[go: up one dir, main page]

ES3033963T3 - Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome - Google Patents

Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome

Info

Publication number
ES3033963T3
ES3033963T3 ES18759200T ES18759200T ES3033963T3 ES 3033963 T3 ES3033963 T3 ES 3033963T3 ES 18759200 T ES18759200 T ES 18759200T ES 18759200 T ES18759200 T ES 18759200T ES 3033963 T3 ES3033963 T3 ES 3033963T3
Authority
ES
Spain
Prior art keywords
cas9
sequence
target
cas
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18759200T
Other languages
English (en)
Inventor
Guochun Gong
Charleen Hunt
Daisuke Kajimura
Suzanne Hartford
Brian Zambrowicz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Application granted granted Critical
Publication of ES3033963T3 publication Critical patent/ES3033963T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/20Animal model comprising regulated expression system
    • A01K2217/206Animal model comprising tissue-specific expression system, e.g. tissue specific expression of transgene, of Cre recombinase
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0393Animal model comprising a reporter system for screening tests
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Environmental Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Endocrinology (AREA)
  • Pathology (AREA)
  • Rheumatology (AREA)
  • Toxicology (AREA)
  • Urology & Nephrology (AREA)
  • Diabetes (AREA)
  • Virology (AREA)

Abstract

Se proporcionan métodos y composiciones para evaluar la actividad de unión de extremos no homólogos (NHEJ) mediada por CRISPR/Cas y/o la recombinación inducida por CRISPR/Cas de un locus genómico diana con un ácido nucleico donante exógeno in vivo y ex vivo. Los métodos y composiciones emplean células y animales no humanos que comprenden un casete de expresión de Cas, como un casete de expresión de Cas integrado genómicamente, de modo que la proteína Cas pueda estar disponible constitutivamente o de forma específica para cada tejido o tiempo. También se proporcionan métodos y composiciones para la fabricación y el uso de estos animales no humanos, incluyendo su uso para evaluar la actividad de CRISPR/Cas in vivo mediante la administración de ARN guía mediada por virus adenoasociados (AAV) a los animales no humanos. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método para probar la capacidad de una nucleasa CRISPR/Cas9 para modificar un locus genómico diana in vivo, mediante la utilización de un ratón o rata transgénico Cas que comprende un casete de expresión de Cas9 en su genoma
Antecedentes
La tecnología CRISPR/Cas es una nueva modalidad terapéutica prometedora. Sin embargo, existe la necesidad de mejores medios para evaluar la eficacia de la generación de mutaciones o la modificación génica dirigida mediante un agente CRISPR/Cas introducidoin vivo.Una limitación de probar el sistemain vivoes la necesidad de introducir simultáneamente todos los componentes en un organismo vivo. El método típico para introducir estos componentes es transfectar transitoriamente constructos de ADN en células que generarán los ARN y las proteínas apropiados. Aunque es eficaz, este enfoque tiene una desventaja inherente, ya que las células deben confiar en los constructos de ADN plasmídico para primero someterse a la transcripción y después a la traducción antes de que la proteína Cas9 esté disponible para interactuar con el componente de ARNgu. Se necesitan mejores métodos y herramientas para evaluar de manera más eficaz la actividad de los agentes CRISPR/Cas introducidos y para evaluar diferentes métodos y parámetros de suministro para dirigirse a tejidos o tipos de células específicos invivo.Platt y col. “ CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling” , Cell 159 (2014), 440-455, describe un ratón sustituidoRosa26Cas9 dependiente de Cre y un AAV1/2 o AAV9 para el suministro de ARNgu y Cre a los tipos de células requeridos. La patente US-2015/0020223 A1 describe ratones sustituidos Cas9 y, en realizaciones separadas, la utilización del AAV para el suministro y la expresión del Cas9 y el ARN guía. La patente US-2016/049024 A2 describe un ratón sustituido Cas9 Rosa26 dependiente de Cre y un AAV9 para el suministro de ARNgu y Cre a los tipos de células requeridos para la generación de mutantes. La patente WO 2016/049163 A2 describe un ratón sustituido Cas9 Rosa26 dependiente de Cre y un AAV1/2 para el suministro de ARNgu y Cre a los tipos de células requeridos. Chen y col. “A Comparison of Exogenous Promoter Activity at the ROSA26 Locus Using a PhiC31 Integrase Mediated Cassette Exchange Approach in Mouse ES Cells” , PLoS o Ne 6(2011), e23376 compara la actividad de diferentes promotores exógenos en el locus ROSA26. Yang y col. “A dual AAV system enables the Cas9-mediated correction of a metabolic liver disease in newborn mice” , Nat Biotechnol. 34 (2016) 334-338 describe la utilización de un AAV que expresa Cas9 y otro que expresa un ARN guía y un ADN donante para la corrección de una enfermedad hepática metabólica en ratones recién nacidos.
Además, el suministro de agentes biológicamente activos, tales como los agentes CRISPR/Cas, a los sujetos frecuentemente se ve obstaculizada por las dificultades en que los componentes llegan a la célula o tejido diana. Estas restricciones pueden dan como resultado, por ejemplo, en la necesidad de utilizar concentraciones de los agentes mucho más altas de lo que es deseable para lograr un resultado, lo que aumenta el riesgo de efectos tóxicos y efectos secundarios. Se necesitan métodos de suministro mejorados y métodos para evaluar tales métodos de suministroin vivo.
Resumen
La presente invención se refiere a las realizaciones caracterizadas en las reivindicaciones. Se proporcionan métodos para evaluar la capacidad de los agentes nucleasa CRISPR/Cas para modificar un locus genómico dianain vivo,como se caracteriza en las reivindicaciones. En la presente memoria se proporcionan métodos para probar la capacidad de una nucleasa CRISPR/Cas para modificar un locus genómico dianain vivo.Los métodos comprenden: (a) introducir en un animal no humano, es decir, un ratón o una rata, un ARN guía diseñado para dirigirse a una secuencia diana del ARN guía en el locus genómico diana, en donde el animal no humano comprende un casete de expresión de Cas integrado genómicamente que comprende una secuencia codificante de NLS-Cas, en donde el casete de expresión de Cas9 está integrado en un locusRosa26,y en donde el casete de expresión de Cas9 está integrado en el primer intrón del locusRosa26,y en donde el ARN guía se introduce mediante el suministro mediado por virus adenoasociados (AAV); y (b) evaluar la modificación del locus genómico diana.
En los métodos según la presente invención, el AAV es AAV8, y el paso (b) comprende evaluar la modificación del locus genómico diana en el hígado del ratón o la rata.
En los métodos según la presente invención, la vía de suministro del AAV al animal no humano es la inyección intravenosa.
En algunos de tales métodos, se introduce un ácido nucleico donante exógeno en el paso (a), en donde el ácido nucleico donante exógeno se diseña para recombinarse con el locus genómico diana. Opcionalmente, el ácido nucleico donante exógeno es un oligodesoxinucleótido monocatenario (ssODN).
En los métodos según la presente invención, el animal no humano es una rata o un ratón. Opcionalmente, el animal no humano es un ratón.
En algunos de tales métodos, el locus genómico diana comprende un gen diana, y el paso (b) comprende medir la expresión del gen diana o la actividad de una proteína codificada por el gen diana.
En algunos de tales métodos, el paso (b) comprende secuenciar el locus genómico diana en una o más células aisladas del animal no humano.
En algunos de tales métodos, el paso (b) comprende aislar un órgano o tejido diana del animal no humano y evaluar la modificación del locus genómico diana en el órgano o tejido diana. Opcionalmente, el paso (b) comprende evaluar la modificación del locus genómico diana en dos o más tipos de células diferentes dentro del órgano o tejido diana.
En algunos de tales métodos, el paso (b) comprende aislar un órgano o tejido no diana del animal no humano y evaluar la modificación del locus genómico diana en el órgano o tejido no diana.
En algunos de tales métodos, la secuencia codificante de NLS-Cas es una secuencia codificante de NLS-Cas9.
En algunos de tales métodos, el casete de expresión de Cas comprende además una señal de poliadenilación aguas arriba de la secuencia codificante de NLS-Cas, en donde la señal de poliadenilación está flanqueada por sitios de reconocimiento de recombinasas, y en donde la señal de poliadenilación en el casete de expresión de Cas se ha escindido de una manera específica para el tejido. Opcionalmente, la señal de poliadenilación aguas arriba de la secuencia codificante de NLS en el casete de expresión de Cas se ha extirpado en el hígado. Opcionalmente, la recombinasa que reconoce los sitios de reconocimiento de recombinasas en el casete de expresión Cas es una recombinasa Cre. Opcionalmente, el animal no humano comprende además un casete de expresión de la recombinasa Cre integrado genómicamente, en donde el casete de expresión de la recombinasa Cre comprende una secuencia codificante de la recombinasa Cre unida operativamente a un promotor específico de tejido. Opcionalmente, el gen de la recombinasa Cre está unido operativamente a uno de los promotores expuestos en la tabla 2.
En algunos de tales métodos, el casete de expresión de Cas comprende además una señal de poliadenilación aguas arriba de la secuencia codificante de NLS-Cas, en donde la señal de poliadenilación está flanqueada por sitios de reconocimiento de recombinasas, y en donde el método comprende además introducir una recombinasa en el animal no humano de una manera específica para el tejido. Opcionalmente, la recombinasa se introduce mediante suministro mediado por virus adenoasociados (<a>A<v>) o suministro mediado por nanopartículas lipídicas (LNP). Opcionalmente, la recombinasa se introduce mediante suministro mediado por AAV8. Opcionalmente, la recombinasa se introduce en el hígado.
En algunos de tales métodos, el casete de expresión de Cas comprende además una secuencia codificante de proteína fluorescente. Opcionalmente, el casete de expresión de Cas comprende un ácido nucleico multicistrónico que comprende la secuencia codificante NLS-Cas y la secuencia codificante de la proteína fluorescente separadas por un sitio de entrada al ribosoma interno interviniente (IRES) o una secuencia codificante del péptido 2A interviniente. Opcionalmente, el ácido nucleico multicistrónico en el casete de expresión de Cas comprende la secuencia codificante NLS-Cas y una secuencia codificante de proteína fluorescente verde separada por una secuencia codificante del péptido P2A interviniente. En algunos de tales métodos, el casete de expresión de Cas no comprende además una secuencia codificante de proteínas fluorescentes. En algunos de tales métodos, la secuencia codificante de NLS-Cas codifica una proteína Cas que comprende una etiqueta proteica.
En algunos de tales métodos, el casete de expresión de Cas está unido operativamente a un promotor endógeno. En algunos de tales métodos, el casete de expresión de Cas está unido operativamente a un promotor constitutivo exógeno.
En algunos de tales métodos, el extremo 5' del casete de expresión Cas comprende además una secuencia de empalme en 3'.
En algunos de tales métodos, el casete de expresión de Cas codifica una proteína que comprende la secuencia expuesta en la id. de sec. n.°: 13, 16, 19 o 22. Opcionalmente, el casete de expresión Cas comprende la secuencia expuesta en la id. de sec. n.°: 28, 29, 30 o 31. Opcionalmente, el casete de expresión Cas comprende la secuencia expuesta en la id. de sec. n.°: 1, 12, 14, 15, 17, 18, 20 o 21.
En los métodos según la presente invención, el casete de expresión de Cas se integra en un locus de puerto seguro, es decir, en el locusRosa26y el casete de expresión de Cas se integra en el primer intrón del locusRosa26.
En algunos de tales métodos, el animal no humano es heterocigoto para el casete de expresión Cas. En algunos de tales métodos, el animal no humano es homocigoto para el casete de expresión Cas.
En algunos de tales métodos, el animal no humano es un ratón, el AAV es un AAV8, el casete de expresión de Cas está unido operativamente al promotorRosa26endógeno, se inserta en el primer intrón del locusRosa26y comprende de 5' a 3': (i) una secuencia de empalme en 3'; y (ii) una secuencia codificante de NLS-Cas9, y el paso (b) comprende evaluar la modificación del locus genómico diana en el hígado del animal no humano. En algunos de tales métodos, el animal no humano es un ratón, el AAV es un AAV8 suministrado al animal no humano mediante inyección intravenosa, el casete de expresión Cas está unido operativamente al promotorRosa26endógeno, se inserta en el primer intrón del locusRosa26y comprende de 5' a 3': (i) una secuencia de empalme en 3'; y (ii) una secuencia codificante de NLS-Cas9, y el paso (b) comprende evaluar la modificación del locus genómico diana en el hígado del animal no humano.
También se proporcionan métodos para optimizar la capacidad de una nucleasa CRISPR/Cas para modificar un locus genómico dianain vivo,como se caracteriza en las reivindicaciones. Tales métodos comprenden: (I) realizar cualquiera de los métodos anteriores para probar la capacidad de una nucleasa CRISPR/Cas para modificar un locus genómico dianain vivopor primera vez en un primer ratón o rata; (II) cambiar una variable y realizar el método del paso (I) por segunda vez con la variable cambiada en un segundo ratón o rata; y (III) comparar la modificación del locus genómico diana en el paso (I) con la modificación del locus genómico diana en el paso (II), y seleccionar el método que da como resultado la modificación del locus genómico diana con uno o más de mayor eficacia, mayor precisión, mayor consistencia o mayor especificidad.
En algunos de tales métodos, la variable cambiada en el paso (II) es el serotipo AAV. En algunos de tales métodos, la variable cambiada en el paso (II) es la concentración o cantidad del ARN guía introducido en el ratón o la rata. En algunos de tales métodos, la variable cambiada en el paso (II) es el ARN guía (p. ej., la forma o secuencia del ARN guía) introducido en el ratón o la rata. En algunos de tales métodos, el método comprende introducir un ácido nucleico donante exógeno, y en donde la variable cambiada en el paso (II) es el método de suministro para introducir el ácido nucleico donante exógeno en el ratón o la rata. En algunos de tales métodos, el método comprende introducir un ácido nucleico donante exógeno, y la variable cambiada en el paso (II) es la vía de suministro para introducir el ácido nucleico donante exógeno en el ratón o la rata. En algunos de tales métodos, el método comprende introducir un ácido nucleico donante exógeno, y la variable cambiada en el paso (II) es la concentración o cantidad del ácido nucleico donante exógeno introducido en el ratón o la rata. En algunos de tales métodos, el método comprende introducir un ácido nucleico donante exógeno, y la variable cambiada en el paso (II) es la concentración o cantidad del ARN guía introducido en el ratón o la rata en relación con la concentración o cantidad de ácido nucleico donante exógeno introducido en el ratón o la rata. En algunos de tales métodos, la variable cambiada en el paso (II) es el ácido nucleico donante exógeno (p. ej., la forma del ácido nucleico donante exógeno) introducido en el ratón o la rata.
Breve descripción de las figuras
Lafigura 1muestra un alelo de Cas9 (MAID2599; no a escala), que comprende de 5' a 3': una secuencia de empalme en 3'; un primer sitio loxP, un gen de resistencia a la neomicina; una señal de poliadenilación; un segundo sitio LoxP; una secuencia codificante de NLS-Cas9; una secuencia codificante del péptido P2A; y una secuencia codificante de GFP.
Lafigura 2Amuestra la actividad de NHEJ en células madre embrionarias de ratón F1H4 silvestre (los mESC) y las mESC preparadas para Cas9 con y sin el casete de neomicina lox-stop-lox (MAID2599 y MAID2600, respectivamente) después de la introducción de dos ARNgu (en forma de plásmido o como los ARN) dirigidos a las regiones de codones de inicio y parada de un primer gen diana, opcionalmente en combinación con la introducción de un plásmido Cas9. La eficiencia de corte de 5' se midió en el panel izquierdo, la eficiencia de corte de 3' se midió en el panel central y la velocidad a la que se eliminó por completo el ADN interviniente se midió en el panel derecho.
Lafigura 2Bmuestra la eficiencia de corte (panel izquierdo) y la eficiencia de HDR (panel derecho) tras la introducción de un ARNgu (en forma de plásmido o como ARN) dirigido a un segundo gen diana junto con un oligodesoxinucleótido monocatenario (ssODN) como donante de mutación puntual, opcionalmente en combinación con un plásmido Cas9.
Lasfiguras 3A-3Fmuestran imágenes de campo claro de tejidos de hígado(figura 3A),riñón(figura 3B)y cerebro(figura 3C)de ratones silvestres y ratones heterocigotos preparados para Cas9 (MAID2600), e imágenes de fluorescencia de GFP de tejidos de hígado (figura 3D), riñón (figura 3E) y cerebro (figura 3F) en ratones silvestres y ratones preparados para Cas9 (MAID2600).
Lafigura 4Amuestra los niveles de expresión del ARNm de Cas9 en diversos tejidos aislados de ratones heterocigotos preparados para Cas9 (MAID2600) determinados mediante RT-qPCR. El eje y muestra el delta Ct 1 en comparación con el Cas9 Ct promedio del tejido cerebral.
Lafigura 4Bmuestra la expresión de la proteína Cas9 en diversos tejidos aislados de ratones silvestres y ratones heterocigotos preparados para Cas9 (MAID2600). Se utilizó actina como control.
Lafigura 4Cmuestra los niveles de expresión promedio de ARNm de Cas9 y beta-2-microglobulina (B2m) de Cas9 en diversos tejidos aislados de ratones heterocigotos preparados para Cas9 (MAID2600), según lo determinado mediante RT-qPCR. El número de muestras analizadas de cada tipo de tejido se indica por encima de las barras.
Lasfiguras 5A-5Bmuestran el porcentaje de actividad del NHEJ (frecuencia de indel) en un tercer gen diana (gen diana 3) en hepatocitos primarios aislados de ratones silvestres (figura 5A) y ratones Cas9 con casete eliminado (MAID2600;Figura 5B)tras el suministro por nanopartículas lipídicas (LNP) de un ARNm de GFP y un ARNgu de control (muerto), un ARNm de GFP y un ARNgu del gen diana 3, o un ARNm de Cas9 y un ARNgu del gen diana 3. Se probaron concentraciones de ARNm de 15,6, 62,5, 250 y 1000 ng/ml.
Lasfiguras 6A-6Dmuestran los niveles séricos de una proteína que es secretada por el hígado y que se encuentra en el suero y que está codificada por el tercer gen diana (gen diana 3) tras la introducción de un ARNgu del gen diana 3 en ratones silvestres (msCas9 -) o ratones preparados para Cas9 eliminados en casetes (msCas9 ; MAID2600) mediante el suministro hidrodinámico de ADN (HDD), el suministro de nanopartículas lipídicas (LNP) o el suministro de virus adenoasociados (AAV) mediante inyección en la vena de la cola. En algunos casos, también se introdujo Cas9 (en forma de ARNm para el suministro de LNP y en forma de ADN para el suministro de HDD (plásmido Cas9) y AAV). Los ratones no tratados, los ratones de control de LNP, los ratones de control de AAV y los ratones de control de HDD se utilizaron como controles negativos. Para el suministro mediado por LNP, se probaron tres grupos de ratones: (1) Ratones preparados para Cas9 (3 machos 3 hembras; 2 mg/kg de ARN guía de control ARNm de GFP); (2) Ratones preparados para Cas9 (3 machos 3 hembras; 2 mg/kg de ARN guía para el gen diana 3 ARNm de GFP); y (3) Ratones WT (3 machos 3 hembras; 2 mg/kg de ARN guía para el gen diana 3 ARNm de Cas9). Para el suministro mediado por AAV, se probaron dos grupos de ratones: (1) Ratones preparados para Cas9 (3 machos 3 hembras; ARN guía de AAV8 para el gen diana 3); y (2) Ratones WT (3 machos 3 hembras; ARN guía de AAV8 para el gen diana 3 AAV8-Cas9). Para HDD, se probaron dos grupos de ratones: (1) Ratones preparados para Cas9 (3 machos 3 hembras; ARN guía para el gen diana 3); y (2) Ratones WT (3 machos 3 hembras; ARN guía para el gen diana 3 Cas9). Los niveles séricos de la proteína codificada por el gen diana 3 se midieron en ratones macho(figuras 6Ay6B)y ratones hembra(figuras 6Cy6D)y se midieron el día 7(figuras 6Ay6C)y el día 21(figuras 6By6D).
Lafigura 7muestra el porcentaje de actividad del NHEJ (frecuencia de indel) en el locus del gen diana 3 en el hígado en ratones silvestres (mSCas9 -) y ratones Cas9 con casete eliminado (mSCas9 ; MAID2600) un mes después del suministro por nanopartículas lipídicas (LNP) del ARNgu solo o junto con el ARNm Cas9, el suministro hidrodinámico (HDD) del plásmido ARNgu solo o junto con el plásmido Cas9, o el AAV8-ARNgu solo o junto con el AAV8-Cas9.
Lafigura 8Amuestra el porcentaje de actividad del NHEJ (frecuencia de indel) en el locus del gen 4 diana en el hígado en ratones Cas9 con casetes eliminados (MAID2600) 3-4 semanas después del suministro de ARNgu por AAV8 mediante inyección en la vena de la cola. UNT = control no tratado.
Lafigura 8Bmuestra los niveles relativos de expresión del gen diana 4 determinados mediante el análisis TAQMAN en tejido hepático aislado de ratones Cas9 con casetes eliminados (MAID2600) 3-4 semanas después del suministro de ARNgu por AAV8 mediante inyección en la vena de la cola. La mezcla maestra WT se refiere a los cinco virus de ARNgu mezclados e inyectados en ratones silvestres como control negativo.
Lafigura 9muestra una membrana de Western de la expresión de Cas9 en ratones LSL-Cas9 (MAID2599) en muestras de hígado, bazo y riñón aisladas una semana después de la inyección de LNP-Cre mediante inyección en la vena de la cola. Los ratones sin inyecciones de LNP-Cre se utilizaron como control negativo. Los ratones Cas9 con casete eliminado (MAID2600) se utilizaron como control positivo.
Lafigura 10muestra los niveles séricos de una proteína que es secretada por el hígado y que se encuentra en el suero y que está codificada por el tercer gen diana (gen diana 3) 1 semana y 3 semanas después de la inyección de un ARNgu del gen diana 3 en ratones LSL-Cas9 (MAID2599) mediante AAV8, ya sea solo o junto con LNP-Cre. Los ratones sin LNP-Cre ni AAV8-ARNg se utilizaron como control negativo. Todas las condiciones también se probaron en ratones con casetes eliminados (ROSA Cas9; MAID2600).
Lafigura 11muestra el porcentaje de actividad del NHEJ (frecuencia de indel) en el locus del gen 3 diana en hígados aislados 3 semanas después de la inyección de un ARNgu del gen 3 diana en ratones LSL-Cas9 (MAID2599) mediante AAV8, solo o junto con LNP-Cre. Los ratones sin LNP-Cre ni AAV8-ARNg se utilizaron como control negativo. Todas las condiciones también se probaron en ratones con casetes eliminados (ROSA Cas9; MAID2600).
Lafigura 12Amuestra una membrana de Western para Cas9 en hígados aislados de ratones LSL-Cas9 (MAID2599) y ratones LSL-Cas9/Alb-Cre. Se utilizó actina como control de carga.
Lafigura 12Bmuestra una membrana de Western para Cas9 en cerebros aislados de ratones LSL-Cas9 (MAID2599) y ratones LSL-Cas9/Alb-Cre. Se utilizó actina como control de carga.
Lafigura 13muestra los niveles séricos de una proteína que es secretada por el hígado y que se encuentra en el suero y que está codificada por el tercer gen diana (gen diana 3) 1 semana después de la inyección de un ARNgu del gen diana 3 en ratones W<t>, ratones Cas9 con casete eliminado (ROSA Cas9; MAID2600), ratones LSL-Cas9 (MAID2599), ratones con albúmina-Cre o ratones LSL-Cas9/Alb-Cre mediante AAV8.
Lafigura 14muestra cuatro alelos Cas9 diferentes (no a escala), que incluye el alelo MAID2599 (MAID2600 una vez que se elimina el casete lox-stop-lox (LSL)), el alelo MAID2658 (MAID2659 una vez que se elimina el casete LSL), el alelo MAID2660 (MAID2661 una vez que se elimina el casete LSL) y el alelo MAID2672 (MAID2673 una vez que se elimina el casete LSL).
Definiciones
Los términos “ proteína” , “ polipéptido” y “ péptido” , usados indistintamente en la presente memoria, incluyen formas poliméricas de aminoácidos de cualquier longitud, lo que incluye aminoácidos codificados y no codificados y aminoácidos modificados o derivatizados química o bioquímicamente. Los términos también incluyen polímeros que se han modificado, tales como polipéptidos que tienen estructuras peptídicas modificadas.
Se dice que las proteínas tienen un “ N-terminal” y un “ C-terminal” . El término “ N-terminal” se refiere al inicio de una proteína o polipéptido, terminado por un aminoácido con un grupo amino libre (-NH2). El término “ extremo C-terminal” se refiere al final de una cadena de aminoácidos (proteína o polipéptido), terminada por un grupo carboxilo libre (-COOH).
Los términos “ácido nucleico” y “ polinucleótido” , usados indistintamente en la presente memoria, incluyen formas poliméricas de nucleótidos de cualquier longitud, lo que incluye ribonucleótidos, desoxirribonucleótidos o análogos o versiones modificadas de los mismos. Incluyen ADN o ARN de cadena única, de doble cadena y multicatenario, ADN genómico, ADNc, híbridos de ADN-ARN y polímeros que comprenden bases de purina, bases de pirimidina u otras bases nucleotídicas naturales, químicamente modificadas, bioquímicamente modificadas, no naturales o derivatizadas.
Se dice que los ácidos nucleicos tienen “ extremos 5'” y “ extremos 3'” porque los mononucleótidos se hacen reaccionar para formar oligonucleótidos de manera que el fosfato 5' de un anillo de mononucleótido pentosa se une al oxígeno 3' de su vecino en una dirección a través de un enlace fosfodiéster. Un extremo de un oligonucleótido se denomina “ extremo 5'” si su fosfato 5' no está unido al oxígeno 3' de un anillo de mononucleótido pentosa. Un extremo de un oligonucleótido se denomina “ extremo 3'” si su oxígeno 3' no está unido a un fosfato 5' de otro anillo de mononucleótido pentosa. También puede decirse que una secuencia de ácido nucleico, incluso si es interna a un oligonucleótido más grande, tiene extremos 5' y 3'. En una molécula de ADN lineal o circular, los elementos discretos se denominan como que están “ aguas arriba” o en dirección 5' de los elementos “ aguas abajo” o en dirección 3'.
El término “ integrado genómicamente” se refiere a un ácido nucleico que se ha introducido en una célula de manera que la secuencia de nucleótidos se integra en el genoma de la célula. Puede usarse cualquier protocolo para la incorporación estable de un ácido nucleico en el genoma de una célula.
El término “vector de expresión” o “ constructo de expresión” se refiere a un ácido nucleico recombinante que contiene una secuencia codificante deseada unida operativamente a las secuencias de ácido nucleico apropiadas necesarias para la expresión de la secuencia codificante unida operativamente en una célula u organismo huésped particular. Las secuencias de ácidos nucleicos necesarias para la expresión en procariotas usualmente incluyen un promotor, un operador (opcional) y un sitio de unión al ribosoma, así como otras secuencias. En general, se sabe que las células eucariotas utilizan promotores, potenciadores y señales de terminación y poliadenilación, aunque algunos elementos pueden eliminarse y añadirse otros elementos sin sacrificar la expresión necesaria.
El término “vector de direccionamiento” se refiere a un ácido nucleico recombinante que puede introducirse mediante recombinación homóloga, ligadura mediada por unión de extremos no homólogos o cualquier otro medio de recombinación en una posición diana en el genoma de una célula.
El término “vector viral” se refiere a un ácido nucleico recombinante que incluye al menos un elemento de origen viral e incluye elementos suficientes o que permiten el empaquetamiento en una partícula de vector viral. El vector y/o la partícula se pueden utilizar con el fin de transferir ADN, ARN u otros ácidos nucleicos a las células, o bien exvivooin vivo.Se conocen numerosas formas de vectores virales.
El término “ aislado” con respecto a proteínas, ácidos nucleicos y células incluye proteínas, ácidos nucleicos y células que están relativamente purificadas con respecto a otros componentes celulares u organismos que normalmente pueden estar presentesin situ,hasta una preparación sustancialmente pura de la proteína, el ácido nucleico o la célula. El término “ aislado” también incluye proteínas y ácidos nucleicos que no tienen una contraparte natural o proteínas o ácidos nucleicos que se han sintetizado químicamente y, por lo tanto, no están sustancialmente contaminados por otras proteínas o ácidos nucleicos. El término “aislado” también incluye proteínas, ácidos nucleicos o células que se han separado o purificado de la mayoría de los demás componentes celulares o componentes del organismo con los que están naturalmente acompañados (p. ej., otras proteínas celulares, ácidos nucleicos o componentes celulares o extracelulares).
El término “ tipo silvestre” incluye entidades que tienen una estructura y/o actividad como la que se encuentra en un estado o contexto normal (por el contrario a mutante, enferma, alterada, etc.). Los genes y polipéptidos de tipo silvestre existen frecuentemente en múltiples formas diferentes (por ejemplo, alelos).
El término “ secuencia endógena” se refiere a una secuencia de ácido nucleico que se produce naturalmente dentro de una célula o animal no humano. Por ejemplo, una secuencia endógena deRosa26de un animal no humano se refiere a una secuencia nativa deRosa26que se produce naturalmente en el locusRosa26en el animal no humano.
Las moléculas o secuencias “ exógenas” incluyen moléculas o secuencias que normalmente no están presentes en una célula en esa forma. La presencia normal incluye la presencia con relación a la etapa particular de desarrollo y las condiciones ambientales de la célula. Una molécula o secuencia exógena, por ejemplo, puede incluir una versión mutada de una secuencia endógena correspondiente dentro de la célula, tal como una versión humanizada de la secuencia endógena, o puede incluir una secuencia correspondiente a una secuencia endógena dentro de la célula pero en una forma diferente (es decir, no dentro de un cromosoma). Por el contrario, las moléculas o secuencias endógenas incluyen moléculas o secuencias que están presentes normalmente en esa forma en una célula particular en una etapa de desarrollo particular en condiciones ambientales particulares.
El término “ heterólogo” , cuando se usa en el contexto de un ácido nucleico o una proteína, indica que el ácido nucleico o la proteína comprende al menos dos segmentos que no se producen naturalmente juntos en la misma molécula. Por ejemplo, el término “ heterólogo” , cuando se usa con referencia a segmentos de un ácido nucleico o segmentos de una proteína, indica que el ácido nucleico o la proteína comprende dos o más subsecuencias que no se encuentran en la naturaleza en la misma relación entre sí (por ejemplo, unidas). Como ejemplo, una región “ heteróloga” de un vector de ácido nucleico es un segmento de ácido nucleico dentro o unido a otra molécula de ácido nucleico que no se encuentra asociada con la otra molécula en la naturaleza. Por ejemplo, una región heteróloga de un vector de ácido nucleico podría incluir una secuencia codificante flanqueada por secuencias que no se encuentran asociadas con la secuencia codificante en la naturaleza. Igualmente, una región “ heteróloga” de una proteína es un segmento de aminoácidos dentro o unido a otra molécula peptídica que no se encuentra asociada con la otra molécula peptídica en la naturaleza (por ejemplo, una proteína de fusión o una proteína con una etiqueta). De manera similar, un ácido nucleico o una proteína pueden comprender un marcador heterólogo o una secuencia de localización o secreción heteróloga.
La “ optimización de codones” se aprovecha de la degeneración de los codones, como lo demuestra la multiplicidad de combinaciones de codones de tres pares de bases que especifican un aminoácido, e incluye generalmente un proceso de modificación de una secuencia de ácido nucleico para potenciar la expresión en células huésped particulares mediante el reemplazo de al menos un codón de la secuencia nativa con un codón que se usa más frecuentemente o con mayor frecuencia en los genes de la célula huésped a la vez que se mantiene la secuencia de aminoácidos nativa. Por ejemplo, un ácido nucleico que codifica una proteína Cas9 puede modificarse para sustituir codones que tienen una mayor frecuencia de uso en una célula procariota o eucariota determinada, lo que incluye una célula bacteriana, una célula de levadura, una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster o cualquier otra célula huésped, en comparación con la secuencia de ácido nucleico de origen natural. Existen tablas de uso de codones fácilmente disponibles, por ejemplo, en la “ Base de datos de uso de codones” . Estas tablas se pueden adaptar de cierto número de maneras.VéaseNakamura y col. (2000) Nucleic Acids Research 28:292. También están disponibles algoritmos informáticos para la optimización de codones de una secuencia en particular para la expresión en un huésped particular(véase, p. ej.,Gene Forge).
Un “ promotor” es una región reguladora de ADN que comprende generalmente una caja TATA capaz de dirigir a la ARN polimerasa II para iniciar la síntesis de ARN en el sitio de iniciación de la transcripción apropiado para una secuencia polinucleotídica particular. Un promotor puede comprender adicionalmente otras regiones que influyen en la velocidad de iniciación de la transcripción. Las secuencias promotoras descritas en la presente descripción modulan la transcripción de un polinucleótido unido operativamente. Un promotor puede estar activo en uno o más de los tipos de células descritos en la presente descripción (por ejemplo, una célula eucariota, una célula de mamífero no humano, una célula humana, una célula de roedor, una célula pluripotente, un embrión en etapa unicelular, una célula diferenciada, o una combinación de las mismas). Un promotor puede ser, por ejemplo, un promotor constitutivamente activo, un promotor condicional, un promotor inducible, un promotor temporalmente restringido (por ejemplo, un promotor regulado por el desarrollo) o un promotor espacialmente restringido (por ejemplo, un promotor específico de células o específico de tejidos). Pueden encontrarse ejemplos de promotores, por ejemplo, en la patente WO 2013/176772.
Un promotor constitutivo es aquel que está activo en todos los tejidos o en tejidos particulares en todas los estadios de desarrollo. Los ejemplos de promotores constitutivos incluyen el citomegalovirus humano inmediato temprano (hCMV), citomegalovirus de ratón inmediato temprano (mCMV), factor de elongación humano 1 alfa (hEF1a), factor de elongación de ratón 1 alfa (mEF1a), fosfoglicerato quinasa de ratón (PGK), híbrido de beta actina de pollo (CAG o CBh), SV40 temprano y promotores de tubulina beta 2.
Los ejemplos de promotores inducibles incluyen, por ejemplo, promotores regulados químicamente y promotores regulados físicamente. Los promotores regulados químicamente incluyen, por ejemplo, promotores regulados por alcohol (p. ej., un promotor del gen de la alcohol deshidrogenasa (alcA)), promotores regulados por tetraciclina (p. ej., un promotor sensible a la tetraciclina, una secuencia operadora de tetraciclina (tetO), un promotor tet-On o un promotor tet-Off), promotores regulados por esteroides (p. ej., un receptor de glucocorticoides de rata, un promotor de un receptor de estrógeno, o un promotor de un receptor de ecdisona), o promotores regulados por metales (p. ej., un promotor de metaloproteínas). Los promotores regulados físicamente incluyen, por ejemplo, promotores regulados por temperatura (p. ej., un promotor de choque térmico) y promotores regulados por la luz (p. ej., un promotor inducible por la luz o un promotor reprimible por la luz).
Los promotores específicos de tejido pueden ser, por ejemplo, promotores específicos de neuronas, promotores específicos de células de glía, promotores específicos de células musculares, promotores específicos de células cardíacas, promotores específicos de células renales, promotores específicos de células óseas, promotores específicos de células endoteliales o promotores específicos de células inmunitarias (p. ej., un promotor de células B o un promotor de células T).
Los promotores regulados por el desarrollo incluyen, por ejemplo, promotores activos solo durante una fase embrionaria de desarrollo, o solo en una célula adulta.
El “ enlace operativo” o estar “ unido operativamente” incluye la yuxtaposición de dos o más componentes (p. ej., un promotor y otro elemento de secuencia) de tal modo que ambos componentes funcionen normalmente y permitan la posibilidad de que al menos uno de los componentes pueda mediar en una función que se ejerce sobre al menos uno de los otros componentes. Por ejemplo, un promotor puede estar unido operativamente a una secuencia codificante si el promotor controla el nivel de transcripción de la secuencia codificante en respuesta a la presencia o ausencia de uno o más factores reguladores de la transcripción. El enlace operable puede incluir las secuencias que son contiguas entre sí o que actúan en trans (por ejemplo, una secuencia reguladora puede actuar a distancia para controlar la transcripción de la secuencia codificante).
“ Complementariedad” de ácidos nucleicos significa que una secuencia de nucleótidos en una cadena de ácido nucleico, debido a la orientación de sus grupos de nucleobase, forma enlaces de hidrógeno con otra secuencia en una cadena de ácido nucleico opuesta. Las bases complementarias en el ADN son típicamente A con T y C con G. En el ARN, son típicamente C con G y U con A. La complementariedad puede ser perfecta o sustancial/suficiente. La complementariedad perfecta entre dos ácidos nucleicos significa que los dos ácidos nucleicos pueden formar un dúplex en el que cada base del dúplex se une a una base complementaria mediante el emparejamiento de Watson-Crick. Complementario “ sustancial” o “ suficiente” significa que una secuencia en una cadena no es completa y/o perfectamente complementaria a una secuencia en una cadena opuesta, pero que se produce un enlace suficiente entre las bases de las dos cadenas para formar un complejo híbrido estable en un conjunto de condiciones de hibridación (por ejemplo, concentración de sal y temperatura). Tales condiciones pueden predecirse mediante el uso de las secuencias y los cálculos matemáticos estándar para predecir la Tm (temperatura de fusión) de las cadenas hibridadas, o mediante la determinación empírica de la Tm mediante el uso de métodos de rutina. Tm incluye la temperatura a la que una población de complejos de hibridación formados entre dos cadenas de ácido nucleico se desnaturaliza en un 50 % (es decir, una población de moléculas de ácido nucleico de doble cadena se disocia a la mitad en cadenas únicas). A una temperatura por debajo de la Tm, se favorece la formación de un complejo de hibridación, mientras que a una temperatura por encima de la Tm, se favorece la fusión o separación de las cadenas en el complejo de hibridación. La Tm puede estimarse para un ácido nucleico que tiene un contenido conocido de G+C en una solución acuosa de NaCl 1 M mediante el uso, p. ej., de Tm=81,5+0,41 (% G+C), aunque otros cálculos de Tm conocidos tienen en cuenta las características estructurales del ácido nucleico.
La “ condición de hibridación” incluye el entorno acumulativo en el que una cadena de ácido nucleico se une a una segunda cadena de ácido nucleico mediante interacciones de cadenas complementarias y enlaces de hidrógeno para producir un complejo de hibridación. Tales condiciones incluyen los componentes químicos y sus concentraciones (p. ej., sales, agentes quelantes, formamida) de una solución acuosa u orgánica que contiene los ácidos nucleicos, y la temperatura de la mezcla. Otros factores, tales como la duración del tiempo de incubación o las dimensiones de la cámara de reacción, pueden contribuir al ambiente.Véase, p. ej.,Sambrook y col., Molecular Cloning, A Laboratory Manual, 2.sup.nd ed., págs. 1.90 1.91, 9.47-9.51, 11.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989).
La hibridación requiere que los dos ácidos nucleicos contengan secuencias complementarias, aunque son posibles errores de apareamiento entre las bases. Las condiciones apropiadas para la hibridación entre dos ácidos nucleicos dependen de la longitud de los ácidos nucleicos y del grado de complementación, variables que son bien conocidas. Cuanto mayor sea el grado de complementación entre dos secuencias de nucleótidos, mayor será el valor de la temperatura de fusión (Tm) para los híbridos de ácidos nucleicos que tienen esas secuencias. Para las hibridaciones entre ácidos nucleicos con tramos cortos de complementariedad (p. ej., complementariedad de más de 35 o menos, 30 o menos, 25 o menos, 22 o menos, 20 o menos, o 18 o menos nucleótidos), la posición de los errores de apareamiento se vuelve importante (véase Sambrook ycol.,más arriba, 11.7-11.8). Típicamente, la longitud de un ácido nucleico hibridable es de al menos aproximadamente 10 nucleótidos. Longitudes mínimas ilustrativas para un ácido nucleico hibridable incluyen al menos aproximadamente 15 nucleótidos, al menos aproximadamente 20 nucleótidos, al menos aproximadamente 22 nucleótidos, al menos aproximadamente 25 nucleótidos y al menos aproximadamente 30 nucleótidos. Además, la temperatura y la concentración de sal de la solución de lavado pueden ajustarse según sea necesario según factores tales como la longitud de la región de complementación y el grado de complementación.
La secuencia del polinucleótido no necesita ser 100 % complementaria a la de su ácido nucleico diana para ser específicamente hibridable. Además, un polinucleótido puede hibridar sobre uno o más segmentos de tal modo que los segmentos intermedios o adyacentes no estén implicados en el evento de hibridación (por ejemplo, una estructura de bucle o una estructura de horquilla). Un polinucleótido (por ejemplo, ARNg) puede comprender al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 99 % o un 100 % de complementariedad de secuencia con una región diana dentro de la secuencia de ácido nucleico diana a la que se direccionan. Por ejemplo, un ARNg en el que 18 de 20 nucleótidos son complementarios a una región diana y, por lo tanto, se hibridarían específicamente, representaría un 90 % de complementariedad. En este ejemplo, los nucleótidos no complementarios restantes pueden agruparse o intercalarse con nucleótidos complementarios y no es necesario que sean contiguos entre sí o con nucleótidos complementarios.
El porcentaje de complementariedad entre tramos particulares de secuencias de ácidos nucleicos dentro de los ácidos nucleicos se puede determinar de forma rutinaria utilizando los programas BLAST (herramientas básicas de búsqueda de alineamiento local) y los programas PowerBlast (Altschul y col. (1990) J. Mol. Biol. 215:403-410; Zhang y Madden (1997) Genome Res. 7:649-656) o utilizando el programa Gap (Wisconsin Sequence Analysis Package, versión 8 para Unix, Genetics Computer Group, University Research Park, Madison, Wisconsin), utilizando la configuración predeterminada, que utiliza el algoritmo de Smith y Waterman (Adv. Appl. Math., 1981, 2, 482-489).
Los métodos proporcionados en la presente memoria emplean una variedad de diferentes componentes. Algunos componentes a lo largo de la descripción pueden tener variantes y fragmentos activos. Tales componentes incluyen, por ejemplo, proteínas Cas, ARN CRISPR, ARNtracr y ARN guía. La actividad biológica de cada uno de estos componentes se describe en cualquier otro sitio de la presente memoria. El término “ funcional” se refiere a la capacidad innata de una proteína o ácido nucleico (o un fragmento o variante del mismo) para exhibir una actividad o función biológica. Tales actividades o funciones biológicas pueden incluir, por ejemplo, la capacidad de una proteína Cas para unirse a un ARN guía ya una secuencia de ADN diana. Las funciones biológicas de los fragmentos o variantes funcionales pueden ser las mismas o, de hecho, pueden cambiar (por ejemplo, con respecto a su especificidad, selectividad o eficacia) en comparación con el original, pero conservando la función biológica básica.
El término “variante” se refiere a una secuencia de nucleótidos que difiere de la secuencia más prevalente en una población (por ejemplo, en un nucleótido) o una secuencia de proteína diferente de la secuencia más prevalente en una población (por ejemplo, en un aminoácido).
El término “ fragmento” cuando se refiere a una proteína significa una proteína que es más corta o tiene menos aminoácidos que la proteína completa. El término “ fragmento” cuando se refiere a un ácido nucleico significa un ácido nucleico que es más corto o tiene menos nucleótidos que el ácido nucleico de longitud completa. Un fragmento puede ser, por ejemplo, un fragmento N-terminal (es decir, eliminación de una porción del extremo C-terminal de la proteína), un fragmento C-terminal (es decir, eliminación de una porción del extremo N-terminal de la proteína), o un fragmento interno.
“ Identidad de secuencia” o “ identidad” en el contexto de dos polinucleótidos o secuencias polipeptídicas hace referencia a los residuos en las dos secuencias que son iguales cuando se alinean para una máxima correspondencia en una ventana de comparación especificada. Cuando se usa el porcentaje de identidad de secuencia en referencia a las proteínas, las posiciones de los residuos que no son idénticas frecuentemente difieren por sustituciones conservadoras de aminoácidos, donde los residuos de aminoácidos se sustituyen por otros residuos de aminoácidos con propiedades químicas similares (por ejemplo, carga o hidrofobicidad) y, por lo tanto, no cambia las propiedades funcionales de la molécula. Cuando las secuencias difieren en sustituciones conservadoras, el por ciento de identidad de secuencia puede ajustarse al alza para corregir la naturaleza conservadora de la sustitución. Se dice que las secuencias que difieren por dichas sustituciones conservadoras tienen “ similitud de secuencia” o “ similitud” . Los medios para realizar este ajuste son muy conocidos. Típicamente, esto implica calificar una sustitución conservadora como un error de coincidencia parcial en lugar de total, lo que aumenta de este modo el porcentaje de identidad de secuencia. De esta forma, por ejemplo, cuando un aminoácido idéntico recibe una puntuación de 1 y una sustitución no conservadora recibe una puntuación de cero, una sustitución conservadora recibe una puntuación entre cero y 1. La calificación de las sustituciones conservadoras se calcula, por ejemplo, como se implementa en el programa PC/GENE (Intelligenetics, Mountain View, California).
El “ porcentaje de identidad de secuencia” incluye el valor determinado mediante la comparación de dos secuencias alineadas de forma óptima (el mayor número de residuos perfectamente coincidentes) en una ventana de comparación, en donde la porción de la secuencia de polinucleótidos en la ventana de comparación puede comprender adiciones o eliminaciones (es decir, huecos) en comparación con la secuencia de referencia (que no comprende adiciones o eliminaciones) para un alineamiento óptimo de las dos secuencias. El porcentaje se calcula al determinar el número de posiciones en las que aparecen residuos de aminoácidos o bases de ácidos nucleicos idénticas en ambas secuencias para producir el número de posiciones coincidentes, dividir el número de posiciones coincidentes por el número total de posiciones en la ventana de comparación, y multiplicar el resultado por 100 para producir el porcentaje de identidad de secuencia. A menos que se especifique lo contrario (por ejemplo, la secuencia más corta incluye una secuencia heteróloga unida), la ventana de comparación es la longitud total de la más corta de las dos secuencias que se comparan.
Salvo que se indique lo contrario, los valores de identidad/similitud de secuencia incluyen el valor obtenido usando GAP versión 10 usando los siguientes parámetros: % de identidad y % de similitud para una secuencia de nucleótidos usando un peso GAP de 50 y un peso de longitud de 3, y la matriz de puntuación nwsgapdna.cmp; % de identidad y % de similitud para una secuencia de aminoácidos usando un peso GAP de 8 y un peso de longitud de 2, y la matriz de puntuación BLOSUM62; o cualquier programa equivalente de los mismos. “ Programa equivalente” incluye cualquier programa de comparación de secuencias que, para cualquiera de dos secuencias en cuestión, genera un alineamiento que tiene coincidencias idénticas de residuos de aminoácidos o nucleótidos y un por ciento de identidad de secuencia idéntico en comparación con el alineamiento correspondiente generado mediante la versión 10 de GAP.
El término “ sustitución conservadora de aminoácidos” se refiere a la sustitución de un aminoácido que está presente normalmente en la secuencia con un aminoácido diferente de similar tamaño, carga o polaridad. Los ejemplos de sustituciones conservadoras incluyen la sustitución de un residuo no polar (hidrófobo) tal como isoleucina, valina o leucina por otro residuo no polar. Igualmente, los ejemplos de sustituciones conservadoras incluyen la sustitución de un residuo polar (hidrófilo) por otro, tal como entre arginina y lisina, entre glutamina y asparagina, o entre glicina y serina. Adicionalmente, la sustitución de un residuo básico tal como lisina, arginina o histidina por otro, o la sustitución de un residuo ácido tal como ácido aspártico o ácido glutámico por otro residuo ácido, son ejemplos adicionales de sustituciones conservadoras. Los ejemplos de sustituciones no conservadoras incluyen la sustitución de un residuo de aminoácido no polar (hidrófobo) tal como isoleucina, valina, leucina, alanina o metionina por un residuo polar (hidrófilo) tal como cisteína, glutamina, ácido glutámico o lisina y/o un residuo polar por un residuo no polar. Las categorizaciones típicas de aminoácidos se resumen en latabla 1a continuación.
Tabla 1. Categorizaciones de aminoácidos.
Alanina Ala A No polar Neutro 1,8 Arginina Arg R Polar Positivo -4,5 Asparagina Asn N Polar Neutro -3,5
Ácido aspártico Asp D Polar Negativo -3,5 Cisteína Cys C No polar Neutro 2,5
Ácido glutámico Glu E Polar Negativo -3,5 Glutamina Gln Q Polar Neutro -3,5
Glicina Gly G No polar Neutro -0,4 Histidina His H Polar Positivo -3,2 Isoleucina Ile I No polar Neutro 4,5
Leucina Leu L No polar Neutro 3,8
Lisina Lys K Polar Positivo -3,9 Metionina Met M No polar Neutro 1,9 Fenilalanina Phe F No polar Neutro 2,8
Prolina Pro P No polar Neutro -1,6
Serina Ser S Polar Neutro -0,8 Treonina Thr T Polar Neutro -0,7 Triptófano Trp W No polar Neutro -0,9 Tirosina Tyr Y Polar Neutro -1,3
Valina Val V No polar Neutro 4,2
El término “invitro"incluye ambientes artificiales y procesos o reacciones que se producen dentro de un ambiente artificial (por ejemplo, un tubo de ensayo). El término“in vivo"incluye ambientes naturales (por ejemplo, una célula, un organismo o un cuerpo) y los procesos o reacciones que se producen dentro de un ambiente natural. El término“ex vivo"incluye células que se han extraído del cuerpo de un individuo y procesos o reacciones que se producen dentro de dichas células.
El término “ gen indicador” se refiere a un ácido nucleico que tiene una secuencia que codifica un producto génico (típicamente una enzima) que se analiza de manera fácil y cuantificable cuando un constructo que comprende la secuencia del gen informador unida operativamente a un elemento potenciador y/o promotor endógeno o heterólogo se introduce en células que contienen (o que se puede hacer que contengan) los factores necesarios para la activación de los elementos promotores y/o potenciadores. Los ejemplos de genes indicadores incluyen, pero no se limitan a, genes que codifican beta-galactosidasa (lacZ), los genes bacterianos de cloranfenicol acetiltransferasa (cat), genes de luciferasa de luciérnaga, genes que codifican beta-glucuronidasa (GUS) y genes que codifican proteínas fluorescentes. Una “ proteína indicadora” se refiere a una proteína codificada por un gen indicador.
El término “ proteína indicadora fluorescente” , como se usa en la presente descripción, significa una proteína indicadora que es detectable basado en la fluorescencia, en donde la fluorescencia puede provenir directamente de la proteína indicadora, la actividad de la proteína indicadora en un sustrato fluorogénico, o una proteína con afinidad para unirse a un compuesto etiquetado con fluorescencia. Los ejemplos de proteínas fluorescentes incluyen proteínas fluorescentes verdes (por ejemplo, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP y ZsGreenl), proteínas fluorescentes amarillas (por ejemplo, YFP, eYFP, Citrine, Venus, YPet, PhiYFP y ZsYellowl), proteínas fluorescentes azules (por ejemplo, BFP, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire y T-sapphire), proteínas fluorescentes cian (por ejemplo, CFP, eCFP, Cerulean, CyPet, AmCyanl y Midoriishi-Cyan), proteínas fluorescentes rojas (por ejemplo, RFP, mKate, mKate2, mPlum, monómero DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monómero, HcRed-Tándem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry y Jred), proteínas fluorescentes naranjas (por ejemplo, mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine y tdTomato) y cualquier otra proteína fluorescente adecuada cuya presencia en las células pueda detectarse mediante métodos de citometría de flujo.
La reparación en respuesta a rupturas de doble cadena (DSB) se produce principalmente mediante dos vías de reparación de ADN conservadas: recombinación homóloga (HR) y unión de extremos no homólogos (NHEJ).
VéaseKasparek y Humphrey (2011) Seminars in Cell & Dev. Biol. 22:886-897. Igualmente, la reparación de un ácido nucleico diana mediada por un ácido nucleico donante exógeno puede incluir cualquier proceso de intercambio de información genética entre los dos polinucleótidos.
El término “ recombinación” incluye cualquier proceso de intercambio de información genética entre dos polinucleótidos y puede producirse por cualquier mecanismo. La recombinación puede producirse a través de la reparación dirigida por homología (HDR) o la recombinación homóloga (HR). La HDR o la HR incluyen una forma de reparación de ácido nucleico que puede requerir homología de secuencia de nucleótidos, usa una molécula “ donante” como plantilla para la reparación de una molécula “ diana” (es decir, la que experimentó la ruptura de doble cadena) y conduce a la transferencia de información genética del donante a la diana. Sin pretender limitarse por ninguna teoría en particular, tal transferencia puede implicar la corrección del error de coincidencia del ADN heterodúplex que se forma entre la diana rota y el donante, y/o la hibridación de la cadena dependiente de la síntesis, en la que el donante se usa para resintetizar la información genética que formará parte de la diana y/o procesos relacionados. En algunos casos, el polinucleótido donante, una porción del polinucleótido donante, una copia del polinucleótido donante o una porción de una copia del polinucleótido donante se integra en el ADN diana. Véase Pertwee, y col. (2013) Cell 153:910-918; Mandalos y col. (2012) PLOS ONE 7:e45768:1-9; y Wang y col. (2013) Nat Biotechnol. 31:530-532.
La NHEJ incluye la reparación de rupturas de doble cadena en un ácido nucleico mediante la ligadura directa de los extremos rotos entre sí o con una secuencia exógena sin necesidad de una plantilla homóloga. La ligadura de secuencias no contiguas mediante NHEJ a menudo puede dar como resultado eliminaciones, inserciones o translocaciones cerca del sitio de la ruptura de doble cadena. Por ejemplo, la NHEJ también puede dar como resultado la integración dirigida de un ácido nucleico donante exógeno mediante la ligadura directa de los extremos rotos con los extremos del ácido nucleico donante exógeno (es decir, captura basada en NHEJ). Puede preferirse dicha integración dirigida mediada por NHEJ para la inserción de un ácido nucleico donante exógeno cuando las vías de reparación dirigidas por homología (HDR) no son fácilmente utilizables (por ejemplo, en células que no se dividen, células primarias y células que realizan una deficiente reparación de ADN basada en homología). Además, a diferencia de la reparación dirigida por homología, no se necesita conocimiento sobre grandes regiones de identidad de secuencia que flanquean el sitio de escisión (más allá de los extremos no pareados creados por la escisión mediada por Cas), lo que puede ser beneficioso cuando se intenta una inserción dirigida en organismos que tienen genomas de los que existe un conocimiento limitado de la secuencia genómica. La integración puede proceder mediante ligadura de extremos romos entre el ácido nucleico donante exógeno y la secuencia genómica escindida, o mediante ligadura de extremos adherentes (es decir, que tienen extremos no pareados 5' o 3') utilizando un ácido nucleico donante exógeno que está flanqueado por extremos no pareados que son compatibles con los generados por la proteína Cas en la secuencia genómica escindida.Véase, p. ej.,las patentes US-2011/020722, WO 2014/033644, WO 2014/089290 y Maresca y col. (2013) Genome Res. 23(3):539-546. Si se ligan los extremos romos, puede ser necesaria la extirpación del objetivo y/o del donante para generar regiones de microhomología necesarias para la unión de fragmentos, lo que puede crear alteraciones no deseadas en la secuencia objetivo.
Las composiciones o métodos “ que comprenden” o “ que incluyen” uno o más elementos enumerados pueden incluir otros elementos no enumerados específicamente. Por ejemplo, una composición que “ comprende” o “ incluye” una proteína puede contener la proteína sola o en combinación con otros ingredientes. La frase de transición “ que consiste esencialmente en” significa que el alcance de una reivindicación debe interpretarse como que abarca los elementos enumerados especificados en la reivindicación y aquellos que no afectan materialmente la(s) característica(s) básica(s) y novedosa(s) de la invención reivindicada. Por tanto, el término “ que consiste esencialmente en” cuando se usa en una reivindicación de esta invención no pretende ser interpretado como equivalente a “ que comprende” .
“ Opcional” u “ opcionalmente” significa que el evento o circunstancia descrito subsecuentemente puede producirse o no y que la descripción incluye casos en los que se produce el evento o circunstancia y casos en los que no se produce.
La designación de un intervalo de valores incluye todos los números enteros dentro o que definen el intervalo, y todos los subintervalos definidos por números enteros dentro del intervalo.
A menos que sea evidente de otra manera por el contexto, el término “ aproximadamente” abarca valores dentro de un margen estándar de error de medición (por ejemplo, SEM) de un valor indicado.
El término “y/o” se refiere y abarca todas y cada una de las combinaciones posibles de uno o más de los elementos enumerados asociados, así como también la ausencia de combinaciones cuando se interpreta en la alternativa (“ o” ).
El término “ o” se refiere a cualquier miembro de una lista en particular y también incluye cualquier combinación de miembros de esa lista.
Las formas singulares de los artículos “ un” , “ una” y “ el/la” incluye referencias en plural a menos que el contexto lo indique claramente de cualquier otra manera. Por ejemplo, el término “ una proteína Cas” o “ al menos una proteína Cas” puede incluir una pluralidad de proteínas Cas, lo que incluye las mezclas de las mismas.
Estadísticamente significativo significa p <0,05.
Descripción
I. Visión general
La información técnica que se expone a continuación puede, en algunos aspectos, ir más allá de la descripción de la invención, que se define exclusivamente mediante las reivindicaciones adjuntas. La información técnica adicional se proporciona para situar la invención real en un contexto técnico más amplio y para ilustrar posibles desarrollos técnicos relacionados. Tal información técnica adicional, que no entra dentro del alcance de las reivindicaciones adjuntas, no forma parte de la invención. El sistema CRISPR/Cas9 es una herramienta poderosa para la ingeniería del genoma. Una limitación del sistemain vivoes la necesidad de introducir simultáneamente todos los componentes en un organismo vivo. El método típico para introducir estos componentes es transfectar transitoriamente constructos de ADN en células que generarán los ARN y las proteínas apropiados. Aunque es eficaz, este enfoque tiene una desventaja inherente, ya que las células deben confiar en los constructos de ADN plasmídico para primero someterse a la transcripción y después a la traducción antes de que la proteína Cas9 esté disponible para interactuar con el componente de ARNgu. Se necesitan mejores métodos y herramientas para evaluar de manera más eficaz la actividad de los agentes CRISPR/Cas y para evaluar diferentes métodos y parámetros de suministro para dirigirse a tejidos o tipos de células específicosin vivo.
En la presente memoria se proporcionan métodos para evaluar la actividad de unión de extremos no homólogos (NHEJ) mediada por CRISPR/Cas y/o la recombinación inducida por CRISPR/Cas de un locus genómico diana con un ácido nucleico donante exógenoin vivoy exvivo.Los métodos emplean animales no humanos que comprenden un casete de expresión de Cas (p. ej., un casete de expresión de Cas genómicamente integrado) de modo que la proteína Cas pueda estar constitutivamente disponible o, por ejemplo, disponible de una manera específica de tejido o específica de tiempo.
Los animales no humanos que comprenden los casetes de expresión de Cas simplifican el proceso para probar el suministro y la actividad de los componentes de CRISPR/Casin vivoporque solo es necesario introducir los ARN guía en el animal no humano. Además, los casetes de expresión de Cas pueden ser opcionalmente casetes de expresión de Cas condicionales que pueden expresarse selectivamente en tejidos o estadios de desarrollo particulares, reduciendo de este modo el riesgo de toxicidad mediada por Casin vivo,o pueden expresarse constitutivamente para permitir la prueba de actividad en cualquiera y todos los tipos de células, tejidos y órganos.
También se proporcionan métodos para fabricar y utilizar estos animales no humanos para probar y medir la capacidad de una nucleasa CRISPR/Cas para modificar un locus genómico dianain vivo,como se caracteriza en las reivindicaciones. En algunos de tales métodos de ensayo y medición de la capacidad de una nucleasa CRISPR/Cas para modificar un locus genómico dianain vivo,se suministran un ARN guía al animal no humano preparado para CAS mediante suministro mediado por AAV. Como se muestra en el ejemplo 1, el suministro mediado por AAV de ARN guía a ratones listos para Cas9, y particularmente el suministro mediado por AAV8 al hígado, da como resultado niveles sorprendentemente más altos de direccionamiento a CRISPR/Cas que el suministro de ARN guía a través de LNP o HDD a ratones preparados para Cas9 o el suministro de Cas9 y ARN guía a ratones silvestres.
II. Animales no humanos que comprenden casetes de expresión de Cas
Los métodos descritos en la presente memoria utilizan animales no humanos que son ratones o ratas que comprenden casetes de expresión de Cas para evaluar la capacidad de los sistemas de repeticiones palindrómicas cortas agrupadas regularmente intercaladas (CRISPR)/asociados a CRISPR (Cas) o componentes de tales sistemas (p. ej., ARN guía introducidos en el animal o célula no humano) para modificar un locus genómico dianain vivo.
Los sistemas CRISPR/Cas incluyen transcripciones y otros elementos involucrados en la expresión o dirección de la actividad de los genes Cas. Un sistema CRISPR/Cas puede ser, por ejemplo, un sistema de tipo I, tipo II o tipo III. Alternativamente, un sistema CRISPR/Cas puede ser un sistema de tipo V (p. ej., subtipo V-A o subtipo V-B). Los sistemas CRISPR/Cas utilizados en los métodos descritos en la presente memoria pueden ser de origen no natural. Un sistema de “ origen no natural” incluye cualquier cosa que indique la participación de la mano del hombre, tal como uno o más componentes del sistema alterados o mutados de su estado de origen natural, estando al menos sustancialmente libre de al menos otro componente con los que están naturalmente asociados en la naturaleza, o están asociados con al menos otro componente con el que no están naturalmente asociados. Por ejemplo, los sistemas CRISPR/Cas de origen no natural pueden emplear complejos CRISPR que comprenden un ARNg y una proteína Cas que no se producen naturalmente juntos, una proteína Cas que no se produce naturalmente o un ARNg que no se produce naturalmente.
Los métodos descritos en la presente memoria emplean los sistemas CRISPR/Cas probando la capacidad de los complejos CRISPR (que comprenden un ARN guía (ARNg) complejado con una proteína Cas) para inducir eventos de escisión dirigidos al sitio dentro de un locus genómico dianain vivopara modificar el locus genómico diana mediante unión de extremos no homólogos (NHEJ), mediante reparación dirigida por homología en presencia de un ácido nucleico donante exógeno, o mediante cualquier otro medio de reparación o recombinación.
A. Animales no humanos preparados para Cas9
Los animales no humanos descritos en la presente memoria comprenden un casete de expresión de Cas. Las proteínas Cas generalmente comprenden al menos un dominio de reconocimiento o unión a ARN que puede interactuar con los ARN guía (los ARNg, descritos con más detalle a continuación) y dominios nucleasa. Un dominio de nucleasa posee actividad catalítica para la escisión de ácidos nucleicos, que incluye la ruptura de los enlaces covalentes de una molécula de ácido nucleico. La escisión puede producir extremos romos o extremos escalonados, y puede ser de cadena única o de doble cadena. Una proteína Cas puede tener una actividad de escisión completa para crear una ruptura de doble cadena en el ácido nucleico diana (p. ej., una ruptura de doble cadena con extremos romos), o puede ser una nickasa que crea una ruptura de cadena única en el ácido nucleico diana.
Las células o los animales no humanos que comprenden un casete de expresión de Cas tienen la ventaja de necesitar el suministro únicamente de ARN guía para detectar la modificación mediada por CRISPR/Cas de un locus genómico diana.
(1) Casetes de expresión de Cas
Los animales no humanos descritos en la presente memoria comprenden un casete de expresión de Cas. El casete de expresión de Cas está integrado de manera estable en el genoma (es decir, en un cromosoma) del animal no humano. El casete de expresión de Cas integrado de manera estable está integrado en una región predeterminada del genoma del animal no humano (es decir, sustituido). Según la invención, el casete de expresión de Cas está integrado de manera estable en un locus de puerto seguro como se describe en cualquier otro sitio de la presente memoria. El locus genómico diana en donde el casete de expresión de Cas está integrado de manera estable puede ser heterocigoto para el casete de expresión de Cas u homocigoto para el casete de expresión de Cas.
La proteína Cas codificada por el casete de expresión de Cas es una proteína Cas9, cuyos ejemplos se describen a continuación. La proteína Cas codificada comprende además una o más señales de localización nuclear (NLS) (p. ej., una NLS N-terminal y una NLS C-terminal), y la secuencia que codifica la proteína Cas puede optimizarse con codones para la célula o el animal no humano, según se describe a continuación. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína Cas9 expuesta en la id. de sec. n.°: 19. La secuencia codificante puede comprender, consistir esencialmente en o consistir en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia codificante de Cas9 expuesta en la id. de sec. n.°: 30.
Un ejemplo de un casete de expresión de Cas comprende una secuencia codificante de Cas aguas abajo de una señal de poliadenilación o un terminador de la transcripción flanqueada por sitios de reconocimiento de recombinasas reconocidos por una recombinasa específica del sitio. La señal de poliadenilación o el terminador de la transcripción evita la transcripción y la expresión de la proteína Cas. Sin embargo, tras la exposición a la recombinasa específica del sitio, se extirpará la señal de poliadenilación o el terminador de la transcripción y se puede expresar la proteína Cas.
Tal configuración para un casete de expresión de Cas puede permitir la expresión específica de tejido o la expresión específica del estadio de desarrollo en animales no humanos que comprenden el casete de expresión de Cas si la señal de poliadenilación o el terminador de la transcripción se extirpa de una manera específica del tejido o manera específica del estadio de desarrollo. Esto puede reducir la toxicidad debido a la expresión prolongada de la proteína Cas en una célula o un animal no humano o a la expresión de la proteína Cas en estadios de desarrollo no deseados o en tipos de células o tejidos no deseados dentro de un animal no humano. Por ejemplo, la toxicidad podría resultar de la escisión y rotura de sitios fuera de la diana.Véase, p. ej.,Parikh ycol.(2015)PLoS One10(1):e0116484. La expresión inducible también puede ser beneficiosa porque la posibilidad de editar algunos genes en ciertos tejidos (p. ej., como las células inmunitarias) puede ser perjudicial y provocar una respuesta inmunitaria. Por ejemplo, en algunos casos, si un gen muta en todo el individuo, puede ser letal, pero si muta en un tejido o tipo de célula específico, sería beneficioso. La escisión de la señal de poliadenilación o el terminador de la transcripción de una manera específica del tejido o del estadio de desarrollo se puede lograr si el animal no humano que comprende el casete de expresión de Cas comprende además la recombinasa específica del sitio unida operativamente a un promotor específico del tejido o específico del estadio de desarrollo (p. ej., el promotor de la albúmina para la expresión específica del hígado o el promotor de la insulina 2 para la expresión específica del páncreas). Similarmente, se pueden utilizar formulaciones de LNP específicas para el hígado u otros tejidos para suministrar la recombinasa, o se pueden utilizar métodos de suministro de AAV o serotipos de AAV específicos para tejidos particulares (p. ej., AAV8 para el hígado o inyección directa de AAV para el páncreas) para suministrar la recombinasa. La señal de poliadenilación o el terminador de la transcripción se extirparán entonces solo en esos tejidos o en esos estadios de desarrollo, lo que permitirá la expresión específica del tejido o la expresión específica del estadio de desarrollo de la proteína Cas. En un ejemplo, la proteína Cas se puede expresar de una manera específica para el hígado. Los ejemplos de tales promotores que se han utilizado para desarrollar tales cepas “ delecionador de recombinasas” de animales no humanos se describen en cualquier otro sitio de la presente memoria.
Se puede utilizar cualquier terminador de la transcripción o señal de poliadenilación. Un “terminador de la transcripción” , como se utiliza en la presente memoria, se refiere a una secuencia de ADN que provoca la terminación de la transcripción. En eucariotas, los factores proteicos reconocen los terminadores de la transcripción, y la terminación va seguida de la poliadenilación, un proceso por el que se añade una cola de poli(A) a las transcripciones del ARNm en presencia de la poli(A) polimerasa. La señal de poli(A) de mamífero consiste típicamente en una secuencia central, de aproximadamente 45 nucleótidos de longitud, que puede estar flanqueada por diversas secuencias auxiliares que sirven para mejorar la eficiencia de la escisión y la poliadenilación. La secuencia central consiste en un elemento aguas arriba altamente conservado (AATAAA o AAUAAA) en el ARNm, denominado motivo de reconocimiento poli A o secuencia de reconocimiento poli A), reconocido por la escisión y el factor de especificidad de poliadenilación (CPSF), y una región aguas abajo mal definida (rica en Us o Gs y Us), unida por el factor de estimulación de la escisión (CstF). Los ejemplos de terminadores de la transcripción que se pueden utilizar incluyen, por ejemplo, la señal de poliadenilación de la hormona del crecimiento humano (HGH), la señal de poliadenilación tardía del virus de simio 40 (SV40), la señal de poliadenilación de la beta-globina de conejo, la señal de poliadenilación de la hormona del crecimiento bovino (BGH), la señal de poliadenilación de la fosfoglicerato quinasa (PGK), una secuencia de terminación de la transcripción de AOX1, una secuencia de terminación de la transcripción de CYC1, o cualquier secuencia de terminación de la transcripción que se sepa que es adecuada para regular la expresión génica en células eucariotas.
Las recombinasas específicas de sitio incluyen enzimas que pueden facilitar la recombinación entre sitios de reconocimiento de recombinasas, donde los dos sitios de recombinación están separados físicamente dentro de un único ácido nucleico o en ácidos nucleicos separados. Los ejemplos de recombinasas incluyen las recombinasas Cre, Flp y Dre. Un ejemplo de un gen de recombinasa Cre es Crei, en el que dos exones que codifican la recombinasa Cre están separados por un intrón para evitar su expresión en una célula procariota. Dichas recombinasas pueden comprender además una señal de localización nuclear para facilitar la localización en el núcleo (por ejemplo, NLS-Crei). Los sitios de reconocimiento de recombinasa incluyen secuencias de nucleótidos que son reconocidas por una recombinasa específica de sitio y pueden servir como sustrato para un evento de recombinación. Los ejemplos de sitios de reconocimiento de recombinasa incluyen FRT, FRT11, FRT71, attp, att, rox y sitios lox tales como loxP, lox511, lox2272, lox66, lox71, loxM2 y lox5171.
El casete de expresión de Cas puede estar unido operativamente a cualquier promotor adecuado para la expresión¡n vivodentro de un animal no humano. El animal no humano puede ser cualquier animal no humano adecuado, como se describe en cualquier otro sitio de la presente memoria. Como un ejemplo, el casete de expresión de Cas puede estar unido operativamente a un promotor endógeno en un locus genómico diana, tal como un promotorRosa26.Alternativamente, el casete de expresión de Cas puede unirse operativamente a un promotor exógeno, tal como un promotor constitutivamente activo (p. ej., un promotor CAG o un promotor/potenciador de la beta actina de pollo junto con el potenciador inmediato temprano (CAGG) del citomegalovirus (CMV), un promotor condicional, un promotor inducible, un promotor restringido temporalmente (p. ej., un promotor regulado por el desarrollo), o un promotor espacialmente promotor restringido (p. ej., un promotor específico de célula o tejido). Tales promotores son bien conocidos y se describen en cualquier otro sitio de la presente memoria. Un promotor CAGG ilustrativo se expone en la id. de sec. n.°: 38 o comprende, consiste esencialmente en, o consiste en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 38.
Los casetes de expresión de Cas descritos en la presente memoria también pueden comprender otros componentes. Un casete de expresión de Cas puede comprender además una secuencia de corte y empalme en 3' en el extremo 5' del casete de expresión de Cas y/o una segunda señal de poliadenilación que sigue a la secuencia codificante de la proteína Cas en el extremo 3' del casete de expresión de Cas. Un casete de expresión de Cas puede comprender además un casete de selección que comprende, por ejemplo, la secuencia codificante de una proteína de resistencia a fármacos. Los ejemplos de marcadores de selección adecuados incluyen neomicina fosfotransferasa (neo<r>), higromicina B fosfotransferasa (hyg<r>), puromicina-N-acetiltransferasa (puro<r>), blasticidina S desaminasa (bsr<r>), xantina/guanina fosforribosil transferasa (gpt) y timidina quinasa del virus del herpes simple (HSV-k). Opcionalmente, el casete de selección puede estar flanqueado por sitios de reconocimiento de recombinasas para una recombinasa específica de sitio. Si el casete de expresión de Cas también comprende sitios de reconocimiento de recombinasa que flanquean una señal de poliadenilación aguas arriba de la secuencia codificante de Cas como se describió anteriormente, opcionalmente se utiliza un conjunto diferente de sitios de reconocimiento de recombinasa reconocidos por una recombinasa diferente para flanquear el casete de selección. Alternativamente, el mismo conjunto de sitios de reconocimiento de recombinasas puede flanquear tanto la señal de poliadenilación aguas arriba de la secuencia codificante de Cas como el casete de selección. Una secuencia de poliadenilación neo<r>ilustrativa se expone en la id. de sec. n. °: 37 o comprende, consiste esencialmente en, o consiste en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n. °: 37.
Un casete de expresión de Cas también puede comprender un ácido nucleico que codifica una etiqueta proteica, tal como una etiqueta 3xFLAG. Un ejemplo de tal etiqueta se expone en la id. de sec. n.°: 23, que está opcionalmente codificada por la id. de sec. n.°: 34. Por ejemplo, la etiqueta puede estar en el extremo N de la proteína Cas, en el extremo C de la proteína Cas o internamente dentro de la proteína Cas. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína 3xFLAG-Cas9 expuesta en la id. de sec. n.°: 22 o la secuencia de la proteína 3xFLAG-Cas9-P2A-eGFP expuesta en la id. de sec. n.°: 16. La secuencia codificante puede comprender, consistir esencialmente en o consistir en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia codificante de 3xFLAG-Cas9 expuesta en la id. de sec. n.°: 31 o la secuencia codificante de 3xFLAG-Cas9-P2A-EGFP expuesta en la id. de sec. n.°: 29, respectivamente.
Un casete de expresión de Cas también puede comprender un ácido nucleico que codifica una o más proteínas indicadoras, tal como una proteína fluorescente (p. ej., una proteína fluorescente verde). Se puede utilizar cualquier proteína indicadora adecuada. Por ejemplo, se puede utilizar una proteína indicadora fluorescente como se define en cualquier otro sitio de la presente memoria, o se puede utilizar una proteína indicadora no fluorescente. Los ejemplos de proteínas indicadoras fluorescentes se proporcionan en cualquier otro sitio de la presente memoria. Las proteínas indicadoras no fluorescentes incluyen, por ejemplo, proteínas indicadoras que pueden usarse en ensayos histoquímicos o bioluminiscentes, tales como beta-galactosidasa, luciferasa (p. ej., luciferasa de Renilla, luciferasa de luciérnaga y luciferasa de NanoLuc) y betaglucuronidasa. Un casete de expresión de Cas puede incluir una proteína indicadora que se puede detectar en un ensayo de citometría de flujo (p. ej., una proteína indicadora fluorescente tal como una proteína fluorescente verde) y/o una proteína indicadora que se puede detectar en un ensayo histoquímico (p. ej., una proteína beta-galactosidasa). Un ejemplo de tal ensayo histoquímico es la visualización de la expresión de beta-galactosidasain situhistoquímicamente a través de la hidrólisis de X-Gal (5-bromo-4-cloro-3-indoil-b-D-galactopiranósido), que produce un precipitado azul, o el uso de sustratos fluorogénicos tales como beta-metil umbeliferil galactósido (MUG) y digalactósido de fluoresceína (FDG).
El casete de expresión de Cas en tales casos puede comprender un ácido nucleico multicistrónico. Por ejemplo, tales ácidos nucleicos pueden separar la secuencia codificante de la proteína Cas y la secuencia codificante de la proteína indicadora (en cualquier orden) por un sitio de entrada al ribosoma interno interviniente (IRES) o una secuencia codificante del péptido 2A interviniente. Los constructos de expresión multicistrónicos expresan simultáneamente dos o más proteínas separadas del mismo ARNm (es decir, un transcrito producido a partir del mismo promotor). Las estrategias adecuadas para la expresión multicistrónica de proteínas incluyen, por ejemplo, la utilización de un péptido 2A y el uso de un sitio de entrada al ribosoma interno (IRES). Por ejemplo, tales ácidos nucleicos pueden comprender secuencias codificantes para dos o más proteínas indicadoras separadas por un sitio de entrada al ribosoma interno interviniente (IRES) o una secuencia codificante del péptido 2A interviniente. Como un ejemplo, tales vectores multicistrónicos pueden usar uno o más sitios de entrada al ribosoma interno (IRES) para permitir el inicio de la traducción desde una región interna de un ARNm. Como otro ejemplo, tales vectores multicistrónicos pueden utilizar uno o más péptidos 2A. Estos péptidos son pequeños péptidos “ autoescindibles” , que generalmente tienen una longitud de 18 a 22 aminoácidos y producen niveles equimolares de múltiples genes a partir del mismo ARNm. Los ribosomas omiten la síntesis de un enlace peptídico glicil-prolilo en el extremo C de un péptido 2A, lo que lleva a la “escisión” entre un péptido 2A y su péptido inmediatamente posterior.Véase, p. ej.,Kim y col. (2011)PLoS One6 (4): e18556. La “ escisión” se produce entre los residuos de glicina y prolina que se encuentran en el extremo C, lo que significa que al cistrón aguas arriba se le añadirán algunos residuos adicionales al final, mientras que al cistrón aguas abajo comenzará con la prolina. Como resultado, el péptido “ escindido” aguas abajo tiene prolina en su extremo N. La escisión mediada por 2A es un fenómeno universal en todas las células eucariotas. Los péptidos 2A se han identificado a partir de picornavirus, virus de insectos y rotavirus de tipo C.Véase, p. ej.,Polleux y col. (2005) Expert Opin Biol Ther 5:627-638. Los ejemplos de péptidos 2A que se pueden utilizar incluyen el virusThosea asigna2A (T2A); teschovirus porcino-1 2A (p2a ); virus de la rinitis equina A (ERAV) 2A (E2A); y Fm Dv 2A (F2A). Las secuencias T2A, P2A, E2A y F2A ilustrativas incluyen las siguientes: T2A (EGRGSLL<t>CG<d>VEENPGP; id. de sec. n.°: 2); P2A (ATNFSLLKQAGDVEENPGP; id. de sec. n°: 3); E2A (QCTNYALLKLAGDVESNPGP; id. de sec. n.°: 4); y F2A (VKQTLNFDLLKLAGDVESNPGP; id. de sec. n°: 5). Los residuos de GSG se pueden añadir al extremo 5' de cualquiera de estos péptidos para mejorar la eficacia de la escisión. Una secuencia codificante ilustrativa para P2A con residuos de GSG añadidos en el extremo 5' se expone en la id. de sec. n.°: 32 o comprende, consiste esencialmente en o consiste en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 32. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína Cas9-P2A-eGFP expuesta en la id. de sec. n.°: 13 o la secuencia de la proteína 3xFLAG-Cas9-P2A-eGFP expuesta en la id. de sec. n.°: 16. La secuencia codificante puede comprender, consistir esencialmente en o consistir en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia codificante de Cas9-P2A-EGFP expuesta en la id. de sec. n.°: 28 o la secuencia codificante de 3xFLAG-Cas9-P2A-EGFP expuesta en la id. de sec. n.°: 29, respectivamente.
Los casetes de expresión de Cas también pueden comprender otros elementos, tales como elementos reguladores postranscripcionales o señales de poliadenilación aguas abajo de la secuencia codificante de Cas. Un elemento regulador postranscripcional ilustrativo es el elemento regulador postranscripcional (WPRE) del virus de la hepatitis de la marmota expuesto en la id. de sec. n.°: 35 o comprende, consiste esencialmente en, o consiste en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 35. Una señal de poliadenilación ilustrativa es la señal de poliadenilación de la hormona del crecimiento bovina expuesta en la id. de sec. n.°: 36 o comprende, consiste esencialmente en o consiste en una secuencia al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 36.
Un casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) una secuencia de empalme en 3'; (b) una señal de poliadenilación flanqueada por un primer y segundo sitios de reconocimiento de recombinasa para una recombinasa (p. ej., sitios loxP para una recombinasa Cre); (c) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal); (d) una secuencia codificante de la proteína 2A (p. ej., una secuencia codificante de P2A); y (e) una secuencia codificante para una proteína indicadora (p. ej., una proteína indicadora fluorescente, tal como una proteína fluorescente verde).Véase, p. ej.,lafigura 1y MAID2599 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 1. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína Cas9-P2A-eGFP expuesta en la id. de sec. n.°: 13.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) una secuencia de empalme en 3'; (b) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal); (c) una secuencia codificante de la proteína 2A (p. ej., una secuencia codificante de P2A); y (d) una secuencia codificante para una proteína indicadora (p. ej., una proteína indicadora fluorescente, tal como una proteína fluorescente verde).Véase, p. ej.,MAID2600 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 12. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína Cas9 P2A-eGFP expuesta en la id. de sec. n.°: 13.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) una secuencia de empalme en 3'; (b) una señal de poliadenilación flanqueada por un primer y segundo sitios de reconocimiento de recombinasa para una recombinasa (p. ej., sitios loxP para una recombinasa Cre); y (c) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal).Véase, p. ej,MAID2660 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 17. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína Cas9 expuesta en la id. de sec. n.°: 19.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) una secuencia de empalme en 3'; y (b) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS- Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal).Véase, p. ej.,MAID2661 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 18. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína Cas9 expuesta en la id. de sec. n.°: 19.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) un promotor exógeno (p. ej., un promotor constitutivo, tal como un promotor CAGG); (b) una señal de poliadenilación flanqueada por un primer y segundo sitios de reconocimiento de recombinasa para una recombinasa (p. ej., sitios loxP para una recombinasa Cre); (c) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una n Ls en el extremo C-terminal, opcionalmente con una etiqueta en el extremo N-terminal o C-terminal, tal como una etiqueta 3xFLAG en el extremo N-terminal); (d) una secuencia codificante de la proteína 2A (p. ej., una secuencia codificante de P2A); y (e) una secuencia codificante para una proteína indicadora (p. ej., una proteína indicadora fluorescente, tal como una proteína fluorescente verde).Véase, p. ej.,MAID2658 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 14. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína 3xFLAG-Cas9-P2A-eGFP expuesta en la id. de sec. n.°: 16.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) un promotor exógeno (p. ej., un promotor constitutivo, tal como un promotor CAGG); (b) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal, opcionalmente con una etiqueta en el extremo N-terminal o C-terminal, tal como una etiqueta 3xFLAG en el extremo N-terminal); (c) una secuencia codificante de la proteína 2A (p. ej., una secuencia codificante de P2A); y (d) una secuencia codificante para una proteína indicadora (p. ej., una proteína indicadora fluorescente, tal como una proteína fluorescente verde).Véase, p. ej,MAID2659 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 15. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína 3xFLAG-Cas9-P2A-eGFP expuesta en la id. de sec. n.°: 16.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) un promotor exógeno (p. ej., un promotor constitutivo, tal como un promotor CAGG); (b) una señal de poliadenilación flanqueada por un primer y segundo sitios de reconocimiento de recombinasa para una recombinasa (p. ej., sitios loxP para una recombinasa Cre); y (c) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal, opcionalmente con una etiqueta en el extremo N-terminal o C-terminal, tal como una etiqueta 3xFLAG en el extremo N-terminal).Véase, p. ej.,MAID2672 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94%, 95%, 96%, 97%, 98 %, 99 % o 100%idéntica a la secuencia expuesta en la id. de sec. n.°: 20. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína 3xFLAG-Cas9 expuesta en la id. de sec. n.°: 22.
Otro casete de expresión ilustrativo de Cas comprende de 5' a 3': (a) un promotor exógeno (p. ej., un promotor constitutivo, tal como un promotor CAGG); y (b) una secuencia codificante de la proteína Cas (p. ej., una secuencia codificante de NLS-Cas9, tal como con una NLS en el extremo N-terminal y una NLS en el extremo C-terminal, opcionalmente con una etiqueta en el extremo N-terminal o C-terminal, tal como una etiqueta 3xFLAG en el extremo N-terminal).Véase, p. ej.,MAID2673 en lafigura 14.Tal casete de expresión puede comprender, consistir esencialmente en o consistir en una secuencia que es al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia expuesta en la id. de sec. n.°: 21. Por ejemplo, tal casete de expresión puede codificar una proteína que comprende, consiste esencialmente en o consiste en una secuencia de aminoácidos al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idéntica a la secuencia de la proteína 3xFLAG-Cas9 expuesta en la id. de sec. n.°: 22.
Los casetes de expresión de Cas descritos en la presente memoria pueden estar en cualquier forma. Por ejemplo, un casete de expresión de Cas puede estar en un vector o plásmido, tal como un vector viral. El casete de expresión de Cas se puede unir operativamente a un promotor en un constructo de expresión capaz de dirigir la expresión de la proteína Cas tras la eliminación de la señal de poliadenilación aguas arriba. Alternativamente, un casete de expresión de Cas puede estar en un vector de direccionamiento como se describe en cualquier otro sitio de la presente memoria. Por ejemplo, el vector de direccionamiento puede comprender brazos de homología que flanquean el casete de expresión de Cas, en donde los brazos de homología son adecuados para dirigir la recombinación con un locus genómico diana deseado para facilitar la integración genómica.
Los casetes de expresión de Cas descritos en la presente memoria pueden serin vitro,pueden estar dentro de una célula (p. ej., una célula madre embrionaria) exvivo(p. ej., genómicamente integrados o extracromosómicos), o pueden estar en un organismo (p. ej., un animal no humano)in vivo(p. ej., genómicamente integrados o extracromosómicos). Si esex vivo,el casete de expresión de Cas puede estar en cualquier tipo de célula de cualquier organismo, tal como una célula totipotente tal como una célula madre embrionaria (p. ej., una célula madre embrionaria de ratón o rata) o una célula madre pluripotente inducida (p. ej., una célula madre pluripotente inducida en humanos). Si estáin vivo,el casete de expresión de Cas puede estar en cualquier tipo de organismo (p. ej., un animal no humano como se describe más adelante en cualquier otro sitio de la presente memoria).
(2) Proteínas Cas y polinucleótidos que codifican proteínas Cas
Las proteínas Cas generalmente comprenden al menos un dominio de reconocimiento o unión a ARN que puede interactuar con los ARN guía (los ARNg, descritos con más detalle a continuación). Las proteínas Cas también pueden comprender dominios de nucleasa (p. ej., dominios de ADNasa o ARNasa), dominios de unión a ADN, dominios de helicasa, dominios de interacción proteína-proteína, dominios de dimerización y otros dominios. Algunos de tales dominios (por ejemplo, dominios de ADNasa) pueden ser de una proteína Cas nativa. Pueden añadirse otros dominios de este tipo para hacer una proteína Cas modificada. Un dominio de nucleasa posee actividad catalítica para la escisión de ácidos nucleicos, que incluye la ruptura de los enlaces covalentes de una molécula de ácido nucleico. La escisión puede producir extremos romos o extremos escalonados, y puede ser de cadena única o de doble cadena. Por ejemplo, una proteína Cas9 de tipo silvestre típicamente creará un producto de escisión romo. Alternativamente, una proteína Cpfl de tipo silvestre (por ejemplo, FnCpf1) puede dar como resultado un producto de escisión con una protuberancia 5' de 5 nucleótidos, y la escisión se produce después del par de bases 18 de la secuencia PAM en la cadena no dirigida y después de la base 23 en la cadena diana. Una proteína Cas puede tener una actividad de escisión completa para crear una ruptura de doble cadena en un locus genómico diana (por ejemplo, una ruptura de doble cadena con extremos romos), o puede ser una nickasa que crea una ruptura de cadena única en un locus genómico diana.
Los ejemplos de proteínas Cas incluyen Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8al, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 o Csx12), Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4 y Cu1966, y homólogos o versiones modificadas de los mismos.
Según la presente invención, la proteína Cas es una proteína Cas9 o una proteína derivada de Cas9. Las proteínas Cas9 son de un sistema CRISPR/Cas de tipo II y típicamente comparten cuatro motivos clave con una arquitectura conservada. Los motivos 1, 2 y 4 son motivos similares a RuvC y el motivo 3 es un motivo HNH. Las proteínas Cas9 ilustrativa son deStreptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus,Pelotomaculum thermopropionicum, Addithiobadllus caldus, Addithiobadllus ferrooxidans, Allochromatium vinosum, Marinobader sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscilatoria sp., Petrotoga mobilis, Thermosipho africanus, Acaryochloris marina, Neisseria meningitidis, o Campylobacterjejuni.Los ejemplos adicionales de los miembros de la familia Cas9 se describen en la patente WO 2014/131833Cas9 de S.pyogenes(SpCas9) (número de acceso de SwissProt asignado Q99ZW2) es una proteína Cas9 ilustrativa. Cas9 de S.aureus(SaCas9) (número de acceso de UniProt asignado J7RUA5) es otra proteína Cas9 ilustrativa. Cas9 deCampylobacterjejuni(CjCas9) (número de acceso de UniProt asignado Q0P897) es otra proteína Cas9 ilustrativa.Véase, p. ej.,Kim y col. (2017) Nat. Comm. 8:14500. SaCas9 es más pequeño que SpCas9 y CjCas9 es más pequeño que SaCas9 y SpCas9.
Otro ejemplo de una proteína Cas, sin embargo, que no pertenece a la invención, es una proteína Cpfl (CRISPR dePrevotellayFrancisella1). La Cpfl es una proteína grande (aproximadamente 1300 aminoácidos) que contiene un dominio de nucleasa similar a la RuVC homólogo al dominio correspondiente de Cas9 junto con una contraparte del característico grupo de Cas9 rico en arginina. Sin embargo, la Cpfl carece del dominio de nucleasa HNH que está presente en las proteínas Cas9, y el dominio tipo RuVC es contiguo en la secuencia de Cpf1, a diferencia de Cas9, donde contiene insertos largos, que incluye el dominio HNH.Véase, p. ej.,Zetsche y col. (2015) Cell 163(3):759-771. Las proteínas Cpfl ilustrativas son deFrancisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, bacteria Lachnospiraceae MC20171, Butyrivibrio proteoclasticus, bacteria Peregrinibacteria GW2011_GWA2_33_10, bacteria Parcubacteria GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, bacteria Lachnospiraceae MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, bacteria Lachnospiraceae ND2006, Porphyromonas crevioricanis 3, Prevotella disiensyPorphyromonas macacae.La Cpfl deFrancisella novicidaU112 (FnCpf1; el número de acceso UniProt asignado A0Q7Q2) es una proteína Cpfl ilustrativa.
Las proteínas Cas pueden ser proteínas de tipo natural (es decir, las que se producen en la naturaleza), proteínas Cas modificadas (es decir, variantes de proteína Cas) o fragmentos de proteínas Cas de tipo natural o modificadas. Las proteínas Cas también pueden ser variantes o fragmentos activos con respecto a la actividad catalítica de las proteínas Cas de tipo silvestre o modificadas. Las variantes o fragmentos activos con respecto a la actividad catalítica pueden comprender al menos un 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia con la proteína Cas de tipo silvestre o modificada o una porción de la misma, en donde las variantes activas conservan la capacidad de cortar en un sitio de escisión deseado y por lo tanto conservan la actividad inductora de mella o inductora de ruptura de doble cadena. Se conocen ensayos para la actividad inductora de mella o inductora de ruptura de doble cadena y, en general, miden la actividad global y la especificidad de la proteína Cas sobre sustratos de ADN que contienen el sitio de escisión.
Las proteínas Cas pueden modificarse para aumentar o disminuir uno o más de la afinidad de unión de ácidos nucleicos, la especificidad de unión de ácidos nucleicos y la actividad enzimática. Las proteínas Cas también pueden estar modificadas para cambiar cualquier otra actividad o propiedad de la proteína, tal como la estabilidad. Por ejemplo, uno o más dominios de nucleasa de la proteína Cas pueden modificarse, eliminarse o inactivarse, o una proteína Cas puede truncarse para eliminar dominios que no son esenciales para la función de la proteína o para optimizar (por ejemplo, mejorar o reducir) la actividad o una propiedad de la proteína Cas.
Un ejemplo de una proteína Cas modificada es la proteína SpCas9-HF1 modificada, que es una variante de alta fidelidad de Cas9 deStreptococcus pyogenesque alberga alteraciones (N497A/R661A/Q695A/Q926A) diseñada para reducir los contactos de ADN no específicos.Véase, p. ej.,Kleinstiver y col. (2016) Nature 529(7587):490-495. Otro ejemplo de una proteína Cas modificada es la variante eSpCas9 modificada (K848A/K1003A/R1060A) diseñada para reducir los efectos secundarios.Véase, p. ej.,Slaymaker y col. (2016) Science 351(6268):84-88. Otras variantes de SpCas9 incluyen K855A y K810A/K1003A/R1060A.
Las proteínas Cas pueden comprender al menos un dominio de nucleasa, tal como un dominio de DNasa. Por ejemplo, una proteína Cpfl silvestre generalmente comprende un dominio similar a RuvC que escinde ambas cadenas de a Dn diana, quizás en una configuración dimérica. Las proteínas Cas también pueden comprender al menos dos dominios de nucleasa, tal como los dominios de DNasa. Por ejemplo, una proteína Cas9 de tipo silvestre generalmente comprende un dominio de nucleasa de tipo RuvC y un dominio de nucleasa de tipo HNH. Cada uno de los dominios RuvC y HNH puede cortar una cadena diferente de ADN de doble cadena para hacer una ruptura de doble cadena en el ADN.Véase, p. ej.,Jinek y col. (2012) Science 337:816-821.
Uno o más de los dominios de nucleasa pueden eliminarse o mutarse para que ya no sean funcionales o tengan una actividad nucleasa reducida. Por ejemplo, si uno de los dominios de nucleasa se elimina o muta en una proteína Cas9, la proteína Cas9 resultante puede denominarse nickasa y puede generar una ruptura de cadena única en una secuencia diana de ARN guía dentro de un ADN de doble cadena, pero no una ruptura de doble cadena (es decir, puede escindir la cadena complementaria o la no complementaria, pero no ambas). Un ejemplo de una mutación que convierte Cas9 en una nickasa es una mutación D10A (aspartato a alanina en la posición 10 de Cas9) en el dominio RuvC de Cas9 de S.pyogenes.Asimismo, H939A (histidina a alanina en la posición de aminoácido 839), H840A (histidina a alanina en la posición de aminoácido 840) o N863A (asparagina a alanina en la posición de aminoácido N863) en el dominio HNH de Cas9 de S.pyogenespuede convertir el Cas9 en un nickasa. Otros ejemplos de mutaciones que convierten a Cas9 en una nickasa incluyen las mutaciones correspondientes a Cas9 de S.thermophilus. Véase, p. ej.,Sapranauskas y col. (2011) Nucleic Acids Research 39:9275-9282 y la patente WO 2013/141680. Tales mutaciones pueden generarse mediante el uso de métodos tales como la mutagénesis dirigida al sitio, la mutagénesis mediada por PCR o la síntesis total de genes. Pueden encontrarse ejemplos de otras mutaciones que crean nickasas, por ejemplo, en las patentes WO 2013/176772 y WO 2013/142578.
También se conocen ejemplos de mutaciones inactivantes en los dominios catalíticos de las proteínas Cas9 deStaphylococcus aureus.Por ejemplo, la enzima Cas9 deStaphylococcus aureus(SaCas9) puede comprender una sustitución en la posición N580 (p. ej., sustitución por N580A) y una sustitución en la posición D10 (p. ej., sustitución por D10A) para generar una proteína Cas inactiva en nucleasas.Véase, p. ej.,la patente WO 2016/106236.
También se conocen ejemplos de mutaciones inactivantes en los dominios catalíticos de las proteínas Cpf1. Con referencia a las proteínas Cpfl deFrancisella novicidaU112 (FnCpfl),Acidaminococcussp. BV3L6 (AsCpfl),Lachnospiraceae bacteriumND2006 (LbCpfl) yMoraxella bovoculi237 (MbCpf1 Cpfl), tales mutaciones pueden incluir mutaciones en las posiciones 908, 993 o 1263 de AsCpf1 o las posiciones correspondientes en los ortólogos de Cpfl, o las posiciones 832, 925, 947 o 1180 de LbCpf1 o las posiciones correspondientes en los ortólogos de Cpfl. Tales mutaciones pueden incluir, por ejemplo, una o más mutaciones D908A, E993A y D1263A de AsCpfl o mutaciones correspondientes en ortólogos de Cpfl, o D832A, E925A, D947A y D1180A de LbCpf1 o mutaciones correspondientes en ortólogos de Cpfl.Véase, p. ej.,la patente US-2016/0208243.
Las proteínas Cas también pueden unirse operativamente a polipéptidos heterólogos como proteínas de fusión. Por ejemplo, una proteína Cas se puede fusionar a un dominio de escisión o un dominio de modificación epigenética.Véasela patente WO 2014/089290. Las proteínas Cas también pueden fusionarse con un polipéptido heterólogo proporcionando una mayor o menor estabilidad. El dominio fusionado o polipéptido heterólogo puede ubicarse en el extremo N-terminal, el extremo C-terminal o internamente dentro de la proteína Cas.
Como un ejemplo, una proteína Cas puede fusionarse con uno o más polipéptidos heterólogos que proporcionan localización subcelular. Tales polipéptidos heterólogos pueden incluir, por ejemplo, una o más señales de localización nuclear (NLS) tal como la SV40 NLS monopartita y/o una NLS bipartita unida a alfa-importina para dirigirse al núcleo, una señal de localización mitocondrial para dirigirse a las mitocondrias, una señal de retención de ER, y similares.Véase, p. ej.,Lange y col. (2007) J. Biol. Chem. 282:5101-5105. Tales señales de localización subcelular pueden localizarse en el extremo N-terminal, el extremo C-terminal o en cualquier lugar dentro de la proteína Cas. Una NLS puede comprender un tramo de aminoácidos básicos y puede ser una secuencia monopartita o una secuencia bipartita. Opcionalmente, una proteína Cas puede comprender dos o más NLS, incluida una NLS (por ejemplo, una NLS unida a alfa-importina o una NLS monopartita) en el extremo N-terminal y una NLS (por ejemplo, una V40 NLS o una NLS bipartita) en el extremo C-terminal. Una proteína Cas también puede comprender dos o más NLS en el extremo N-terminal y/o dos o más NLS en el extremo C-terminal.
Las proteínas Cas también pueden unirse operativamente a un dominio de penetración celular o a un dominio de transducción de proteínas. Por ejemplo, el dominio de penetración celular puede derivar de la proteína TAT del VIH-1, el motivo de penetración celular TLM del virus de la hepatitis B humana, MPG, Pep-1, VP22, un péptido de penetración celular del virus Herpes simplex o un secuencia peptídica de poliarginina.Véase, p. ej.,las patentes WO 2014/089290 y WO 2013/176772. El dominio de penetración celular puede localizarse en el extremo N-terminal, el extremo C-terminal o en cualquier lugar dentro de la proteína Cas.
Las proteínas Cas también pueden enlazar operativamente un polipéptido heterólogo para facilitar el seguimiento o la purificación, tal como una proteína fluorescente, una etiqueta de purificación o una etiqueta de epítopo. Los ejemplos de proteínas fluorescentes incluyen proteínas fluorescentes verdes (p. ej.,<g>F<p>, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreenl), proteínas fluorescentes amarillas (p. ej., YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), proteínas fluorescentes azules (p. ej., eBFP, eBFP2, azurita, mKalamal, GFPuv, Sapphire, T-sapphire), proteínas fluorescentes cian (p. ej., eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes rojas (p. ej., mKate, mKate2, mPlum, monómero DsRed, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), proteínas fluorescentes naranjas (p. ej., mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) y cualquier otra proteína fluorescente adecuada. Los ejemplos de etiquetas incluyen glutatión-S-transferasa (GST), proteína de unión a quitina (CBP), proteína de unión a la maltosa, tiorredoxina (TRX), poli(NANP), etiqueta de purificación por afinidad en tándem (TAP), myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, hemaglutinina (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, Kt 3, S, S1, T7, V5, VSV-G, histidina (His), proteína portadora de biotina carboxilo (BCCP) y calmodulina.
Un ácido nucleico que codifica una proteína Cas puede ser optimizado por codones para una traducción eficiente en proteína en una célula u organismo particular. Por ejemplo, el ácido nucleico que codifica la proteína Cas puede modificarse para sustituir codones que tienen una mayor frecuencia de utilización en una célula humana, una célula no humana, una célula de mamífero, una célula de roedor, una célula de ratón, una célula de rata o cualquier otra célula huésped de interés, en comparación con la secuencia de polinucleótidos de origen natural.
(3) ARN guía
Un “ARN guía” o “ARNg” es una molécula de ARN que se une a una proteína Cas (por ejemplo, la proteína Cas9) y dirige la proteína Cas a una localización específica dentro de un ADN diana. Los ARN guía pueden comprender dos segmentos: un “ segmento de direccionamiento de ADN” y un “ segmento de unión a proteínas” . “ Segmento” incluye una sección o región de una molécula, tal como un tramo contiguo de nucleótidos en un ARN. Algunos ARNg, tales como los de Cas9, pueden comprender dos moléculas de ARN separadas: un “ARN activador” (por ejemplo, ARNtracr) y un “ARN direccionador” (por ejemplo, ARN CRISPR o ARNcr). Otros ARNg son una sola molécula de ARN (ARN único polinucleótido), que también puede denominarse “ARNg de molécula única” , “ARN guía único” o “ARNgu” .Véase, p. ej.,las patentes WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578, y WO 2014/131833. Para Cas9, por ejemplo, un ARN guía único puede comprender un ARNcr fusionado con un ARNtracr (por ejemplo, a través de un enlazador). Para Cpf1, por ejemplo, solo se necesita un ARNcr para lograr la unión y/o la escisión de una secuencia diana. Los términos “ARN guía” y “ARNg” incluyen tanto ARNg de molécula doble (es decir, modulares) como ARNg de molécula única.
Un ARNg de dos moléculas ilustrativas comprende una molécula similar a ARNcr (“ARN CRISPR” o “ARN direccionador” o “ARNcr” o “ repetición de ARNcr” ) y una correspondiente molécula similar a ARNtracr (“ARN CRISPR transactivador” o “AR<n>activador” o “ARNtracr” ). Un ARNcr comprende tanto el segmento de direccionamiento al ADN (de cadena única) del ARNg como un tramo de nucleótidos (es decir, la cola del ARNcr) que forma la mitad del dúplex de ARNds del segmento de unión a proteínas del ARNg. Un ejemplo de una cola de ARNcr, localizada aguas abajo (3') del segmento de direccionamiento al ADN, comprende, consiste esencialmente en, o consiste en GUUUUAGAGCUAUGCU (id. de sec. n.°: 25). Cualquiera de los segmentos de direccionamiento al ADN descritos en la presente memoria puede unirse al extremo 5' de id. de sec. n.°: 25 para formar un ARNcr.
Un ARNtracr (ARN activador) correspondiente comprende un tramo de nucleótidos que forma la otra mitad del dúplex de ARNds del segmento de unión a proteínas del ARNg. Un tramo de nucleótidos de un ARNcr son complementarios y se hibridan con un tramo de nucleótidos de un ARNtracr para formar el dúplex de ARNds del dominio de unión a proteínas del ARNg. Como tal, puede decirse que cada ARNcr tiene un ARNtracr correspondiente. Un ejemplo de una secuencia de ARNtracr comprende, consiste esencialmente en o consiste en AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACC GAGUCGGUGCUUU (id. de sec. n.°: 26).
En los sistemas en los que se necesitan tanto un ARNcr como un ARNtracr, el ARNcr y el ARNtracr correspondiente se hibridan para formar un ARNg. En los sistemas en los que solo se necesita un ARNcr, el ARNcr puede ser el ARNg. El ARNcr proporciona adicionalmente el segmento de direccionamiento al ADN monocatenario que se dirige a una secuencia diana de ARN guía hibridándose con la cadena opuesta (es decir, la cadena complementaria). Si se usa para la modificación dentro de una célula, la secuencia exacta de una molécula de ARNcr o ARNtracr determinada puede diseñarse para que sea específica de la especie en la que se usarán las moléculas de ARN.Véase, p. ej.,Mali y col. (2013) Science 339:823-826; Jinek y col. (2012) Science 337:816-821; Hwang y col. (2013) Nat. Biotechnol.
31:227-229; Jiang y col. (2013) Nat. Biotechnol. 31:233-239; y Cong y col. (2013) Science 339:819-823.
El segmento de direccionamiento al ADN (ARNcr) de un ARNg dado comprende una secuencia de nucleótidos que es complementaria a una secuencia (es decir, la cadena complementaria de la secuencia de reconocimiento del ARN guía en la cadena opuesta a la secuencia diana del ARN guía) en un ADN diana. El segmento de direccionamiento de ADN de un ARNg interactúa con un ADN diana de una manera específica de secuencia a través de la hibridación (es decir, emparejamiento de bases). Como tal, la secuencia de nucleótidos del segmento de ADN diana puede variar y determina la localización dentro del ADN diana con el que interactuarán el ARNg y el ADN diana. El segmento de direccionamiento al ADN de un ARNg sujeto puede modificarse para hibridar con cualquier secuencia deseada dentro de un ADN diana. Los ARNcr de origen natural difieren según el sistema CRISPR/Cas y el organismo, pero frecuentemente contienen un segmento de direccionamiento de entre 21 y 72 nucleótidos de longitud, flanqueado por dos repeticiones directas (DR) de una longitud de entre 21 y 46 nucleótidos(véase, p. ej.,la patente WO 2014/131833. En el caso de S.pyogenes,las DR tienen una longitud de 36 nucleótidos y el segmento de direccionamiento tiene una longitud de 30 nucleótidos. La DR localizada en 3' es complementaria y se hibrida con el ARNtracr correspondiente, que a su vez se une a la proteína Cas.
El segmento de direccionamiento al ADN puede tener una longitud de al menos aproximadamente 12 nucleótidos, al menos aproximadamente 15 nucleótidos, al menos aproximadamente 17 nucleótidos, al menos aproximadamente 18 nucleótidos, al menos aproximadamente 19 nucleótidos, al menos aproximadamente 20 nucleótidos, al menos aproximadamente 25 nucleótidos, al menos aproximadamente 30 nucleótidos, al menos aproximadamente 35 nucleótidos o al menos aproximadamente 40 nucleótidos. Tales segmentos de direccionamiento al ADN pueden tener una longitud de aproximadamente 12 nucleótidos a aproximadamente 100 nucleótidos, de aproximadamente 12 nucleótidos a aproximadamente 80 nucleótidos, de aproximadamente 12 nucleótidos a aproximadamente 50 nucleótidos, de aproximadamente 12 nucleótidos a aproximadamente 40 nucleótidos, de aproximadamente 12 nucleótidos a aproximadamente 30 nucleótidos, de aproximadamente 12 nucleótidos a aproximadamente 25 nucleótidos, o de aproximadamente 12 nucleótidos a aproximadamente 20 nucleótidos. Por ejemplo, el segmento de direccionamiento al ADN puede ser de aproximadamente 15 nucleótidos a aproximadamente 25 nucleótidos (p. ej., de aproximadamente 17 nucleótidos a aproximadamente 20 nucleótidos, o aproximadamente 17 nucleótidos, aproximadamente 18 nucleótidos, aproximadamente 19 nucleótidos, o aproximadamente 20 nucleótidos).Véase, p. ej.,la patente US-2016/0024523. Para Cas9 de S.pyogenes,un segmento de direccionamiento al ADN típico tiene una longitud de entre 16 y 20 nucleótidos o una longitud de entre 17 y 20 nucleótidos. Para Cas9 de S.aureus,un segmento de direccionamiento al ADN típico tiene una longitud de entre 21 y 23 nucleótidos. Para C p fl, un segmento de direccionamiento al ADN típico tiene una longitud de al menos 16 nucleótidos de longitud o una longitud de al menos 18 nucleótidos.
Los ARNtracr pueden estar en cualquier forma (por ejemplo, ARNtracr completos o ARNtracr parciales activos) y ser de diferentes longitudes. Pueden incluir transcripciones primarias o formularios procesados. Por ejemplo, los ARNtracr (como parte de un ARN guía único o como una molécula separada como parte de un ARNg de dos moléculas) pueden comprender, consistir esencialmente en, o consistir en la totalidad o una porción de una secuencia de ARNtracr de tipo silvestre (por ejemplo, aproximadamente o más de aproximadamente 20, 26, 32, 45, 48, 54, 63, 67, 85 o más nucleótidos de una secuencia de ARNtracr de tipo silvestre). Los ejemplos de secuencias de ARNtracr de tipo silvestre de S.pyogenesincluyen versiones de 171 nucleótidos, 89 nucleótidos, 75 nucleótidos y 65 nucleótidos.Véase, p. ej.,Deltcheva y col. (2011) Nature 471:602-607; WO 2014/093661. Los ejemplos de ARNtracr dentro de los RNA guía únicos (ARNgs) incluyen los segmentos de ARNtracr que se encuentran en las versiones 48, 54, 67 y 85 de los ARNgs, donde “ n” indica que hasta el nucleótido n del ARNtracr de tipo silvestre está incluido en el ARNgs.Véasela patente US-8.697.359.
El porcentaje de complementariedad entre la secuencia de direccionamiento al ADN y la cadena complementaria de la secuencia de reconocimiento de ARN guía dentro del ADN diana puede ser de al menos el 60 % (p. ej., al menos el 65 %, al menos el 70 %, al menos el 75 %, al menos el 80 %, al menos el 85 %, al menos el 90 %, al menos el 95 %, al menos el 97 %, al menos el 98 %, al menos el 99 % o el 100 %). El porcentaje de complementariedad entre la secuencia de direccionamiento al ADN y la cadena complementaria de la secuencia de reconocimiento del ARN guía dentro del ADN diana puede ser de al menos el 60 % sobre aproximadamente 20 nucleótidos contiguos. Como ejemplo, el porcentaje de complementariedad entre la secuencia de direccionamiento al ADN y la cadena complementaria de la secuencia de reconocimiento del ARN guía dentro del ADN diana es del 100 % sobre los 14 nucleótidos contiguos en el extremo 5' de la cadena complementaria de la secuencia de reconocimiento del ARN guía dentro de la cadena complementaria del ADN diana y tan bajo como el 0 % sobre el resto. En tal caso, puede considerarse que la secuencia de direccionamiento al ADN tiene una longitud de 14 nucleótidos. Como otro ejemplo, el porcentaje de complementariedad entre la secuencia de direccionamiento al ADN y la cadena complementaria de la secuencia de reconocimiento de ARN guía dentro del ADN diana es del 100 % sobre los siete nucleótidos contiguos en el extremo 5' de la cadena complementaria de la secuencia de reconocimiento de ARN guía dentro de la cadena complementaria del ADN diana y tan bajo como el 0 % sobre el resto. En tal caso, puede considerarse que la secuencia de direccionamiento de ADN tiene una longitud de 7 nucleótidos. En algunos ARN guía, al menos 17 nucleótidos dentro de la secuencia de direccionamiento al ADN son complementarios del ADN diana. Por ejemplo, la secuencia de direccionamiento al ADN puede tener una longitud de 20 nucleótidos y puede comprender 1, 2 o 3 errores de apareamiento con la cadena complementaria de la secuencia de reconocimiento del ARN guía. Opcionalmente, los errores de apareamiento no son adyacentes a una secuencia de motivo adyacente al protoespaciador (PAM) (p. ej., los errores de apareamiento están en el extremo 5' de la secuencia de direccionamiento al ADN, o los errores de apareamiento están al menos a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 o 19 pares de bases de distancia de la secuencia Pam).
El segmento de unión a proteínas de un ARNg puede comprender dos tramos de nucleótidos que son complementarios entre sí. Los nucleótidos complementarios del segmento de unión a proteínas se hibridan para formar un dúplex de ARN de doble cadena (ARNds). El segmento de unión a proteínas de un ARNg sujeto interactúa con una proteína Cas, y el ARNg dirige la proteína Cas unida a una secuencia de nucleótidos específica dentro del ADN diana a través del segmento de direccionamiento al ADN.
Los ARN guía únicos tienen el segmento de direccionamiento al ADN y una secuencia de andamio (es decir, la secuencia de unión a proteína o de unión a Cas del ARN guía). Por ejemplo, tales ARN guía tienen un segmento de direccionamiento al ADN 5' y una secuencia de andamio 3'. Las secuencias de andamio ilustrativas comprenden, consisten esencialmente en o consisten en:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGA AAAAGUGGCACCGAGUCGGUGCU (versión 1; id. de sec. n.°: 27);
GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA ACUUGAAAAAGUGGCACCGAGUCGGUGC (versión 2; id. de sec. n.°: 6);
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGA AAAAGUGGCACCGAGUCGGUGC (versión 3; id. de sec. n.°: 7); y
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUU AUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (versión 4; id. de sec. n.°: 8). Los ARN guía que se dirigen a cualquier secuencia diana de ARN guía pueden incluir, por ejemplo, un segmento de direccionamiento al ADN en el extremo 5' del ARN guía fusionado con cualquiera de las secuencias de andamio de ARN guía ilustrativas en el extremo 3' del ARN guía. Es decir, cualquiera de los segmentos de direccionamiento al ADN descritos en la presente memoria puede unirse al extremo 5' de una cualquiera de las id. de sec. n.°: 27, 6, 7 u 8 para formar un único ARN guía (ARN guía quimérico). Las versiones de ARN guía 1, 2, 3 y 4, como se describe en cualquier otro sitio de la presente memoria, se refieren a segmentos de direccionamiento al a Dn unidos con las versiones de andamio 1,2, 3 y 4, respectivamente.
Los ARN guía pueden incluir modificaciones o secuencias que proporcionan características deseables adicionales (p. ej., estabilidad modificada o regulada; direccionamiento subcelular; seguimiento con una etiqueta fluorescente; un sitio de unión para una proteína o un complejo proteico; y similares. Los ejemplos de tales modificaciones incluyen, por ejemplo, una caperuza de 5' (p. ej., una caperuza de 7-metilguanilato (m7G)); una cola poliadenilada de 3' (es decir, una cola de poli(A) de 3'); una secuencia de ribointerruptor (p. ej., para proporcionar estabilidad regulada y/o accesibilidad regulada por proteínas y/o complejos proteicos); una secuencia de control de estabilidad; una secuencia que forma un dúplex de ARNbc (es decir, una horquilla); una modificación o secuencia que dirige el ARN a una ubicación subcelular (p. ej., núcleo, mitocondrias, cloroplastos y similares); una modificación o secuencia que permite el seguimiento (p. ej., la conjugación directa con una molécula fluorescente, la conjugación con un resto que facilita la detección fluorescente, una secuencia que permite la detección fluorescente, y así sucesivamente.); una modificación o secuencia que proporciona un sitio de unión para las proteínas (p. ej., proteínas que actúan sobre el ADN, incluidas las metiltransferasas de ADN, las demitilasas de ADN, las histonas acetiltransferasas, las histonas desacetilasas y similares); y combinaciones de los mismos. Otros ejemplos de modificaciones incluyen estructuras dúplex de bucle de tallo manipuladas genéticamente, regiones salientes manipuladas genéticamente, horquillas 3' manipuladas genéticamente de la estructura dúplex de bucle de tallo o cualquier combinación de las mismas.Véase, p. ej.,la patente US-2015/0376586. Un saliente puede ser una región desapareada de nucleótidos dentro del dúplex formado por la región similar a ARNcr y la región mínima similar a ARNtracr. Un saliente puede comprender, en un lado del dúplex, un 5'-XXXY-3' desapareado donde X es cualquier purina e Y puede ser un nucleótido que puede formar un par oscilante con un nucleótido en la cadena opuesta y una región de nucleótido desapareada del otro lado del dúplex.
Los ácidos nucleicos no modificados pueden ser propensos a la degradación. Los ácidos nucleicos exógenos también pueden inducir una respuesta inmunitaria innata. Las modificaciones pueden ayudar a introducir estabilidad y reducir la inmunogenicidad. Los ARN guía pueden comprender nucleósidos modificados y nucleótidos modificados que incluyen, por ejemplo, uno o más de los siguientes: (1) alteración o reemplazo de uno o ambos de los oxígenos de fosfato no enlazantes y/o de uno o más de los oxígenos de fosfato enlazantes en el enlace principal del fosfodiéster; (2) alteración o reemplazo de un componente del azúcar ribosa, tal como la alteración o reemplazo del 2' hidroxilo del azúcar ribosa; (3) sustitución del resto de fosfato por enlazadores defosforescentes; (4) modificación o reemplazo de una nucleobase natural; (5) reemplazo o modificación de la cadena principal de ribosa-fosfato; (6) modificación del extremo 3' o del extremo 5' del oligonucleótido (p. ej., eliminación, modificación o reemplazo de un grupo fosfato terminal o conjugación de un resto); y (7) modificación del azúcar. Otras posibles modificaciones del ARN guía incluyen modificaciones o sustitución de tractos de uracilo o poliuracilo.Véase, p. ej.,las patentes WO 2015/048577 y US-2016/0237455. Pueden hacerse modificaciones similares a los ácidos nucleicos que codifican Cas, tales como los ARNm de Cas.
Como ejemplo, los nucleótidos en el extremo 5' o 3' de un ARN guía pueden incluir enlaces fosforotioato (por ejemplo, las bases pueden tener un grupo fosfato modificado que es un grupo fosforotioato). Por ejemplo, un ARN guía puede incluir enlaces de fosforotioato entre los 2, 3 o 4 nucleótidos terminales en el extremo 5' o 3' del ARN guía. Como otro ejemplo, los nucleótidos en el extremo 5' y/o 3' de un ARN guía pueden tener modificaciones 2'-O-metilo. Por ejemplo, un ARN guía puede incluir modificaciones 2'-O-metilo en los nucleótidos terminales 2, 3 o 4 en el extremo 5' y/o 3' del ARN guía (por ejemplo, el extremo 5').Véase, p. ej.,la patente WO 2017/173054 A1 y Finn y col. (2018) Cell Reports 22:1-9. En un ejemplo específico, el ARN guía comprende análogos de 2'-O-metilo y enlaces internucleotídicos de fosforotioato 3' en los primeros tres residuos de ARN terminales 5' y 3'. En otro ejemplo específico, el ARN guía se modifica de manera que todos los grupos 2'OH que no interactúan con la proteína Cas9 se reemplazan con análogos de 2'-O-metilo, y la región de la cola del ARN guía, que tiene una interacción mínima con Cas9, se modifica con enlaces internucleotídicos de fosforotioato en 5' y 3'.Véase, p. ej.,Yin y col. (2017) Nat. Biotech. 35(12):1179-1187.
Los ARN guía se pueden proporcionar de cualquier forma. Por ejemplo, el ARNg se puede proporcionar en forma de ARN, ya sea como dos moléculas (ARNcr y ARNtracr separados) o como una molécula (ARNgu), y opcionalmente en forma de un complejo con una proteína Cas. El ARNg también se puede proporcionar en forma de ADN que codifica el ARNg. El ADN que codifica el ARNg puede codificar una sola molécula de ARN (ARNgu) o moléculas de ARN separadas (p. ej., ARNcr y ARNtracr separados). En este último caso, el ADN que codifica el ARNg puede proporcionarse como una molécula de ADN o moléculas de ADN separadas que codifican el ARNcr y el ARNtracr, respectivamente.
Cuando se proporciona un ARNg en la forma de ADN, el ARNg se puede expresar de forma transitoria, condicional o constitutiva en la célula. Los ADN que codifican los ARNg pueden estar integrados de forma estable en el genoma de la célula y estar unidos operativamente a un promotor activo en la célula. Alternativamente, los ADN que codifican los ARNg pueden estar unidos operativamente a un promotor en un constructo de expresión. Por ejemplo, el ADN que codifica el ARNg puede estar en un vector que comprende un ácido nucleico heterólogo, tal como un ácido nucleico que codifica una proteína Cas. Alternativamente, puede estar en un vector o un plásmido que esté separado del vector que comprende el ácido nucleico que codifica la proteína Cas. Los promotores que pueden utilizarse en tal constructo de expresión incluyen promotores activos, por ejemplo, en una o más de una célula eucariota, una célula humana, una célula no humana, una célula de mamífero, una célula de mamífero no humano, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster, una célula de conejo, una célula pluripotente, una célula madre embrionaria (ES), una célula madre adulta, una célula progenitora con desarrollo restringido, una célula madre pluripotente inducida (iPS) o un embrión en estadio unicelular. Tales promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos o promotores específicos de tejido. Tales promotores también pueden ser, por ejemplo, promotores bidireccionales. Ejemplos específicos de promotores adecuados incluyen un promotor de la ARN-polimerasa III, tal como un promotor U6 humano, un promotor de la polimerasa III U6 de rata o un promotor de la polimerasa III U6 de ratón.
Alternativamente, los ARNg pueden prepararse mediante otros métodos diversos. Por ejemplo, los ARNg pueden prepararse mediante transcripciónin vitromediante el uso, por ejemplo, de ARN polimerasa T7(véanse, p. ej.,las patentes WO 2014/089290 y WO 2014/065596). Los ARN guía también pueden ser una molécula producida sintéticamente preparada mediante síntesis química.
(4) Secuencias de reconocimiento de ARN guía y secuencias diana de ARN guía
El término “ secuencia de reconocimiento de ARN guía” incluye secuencias de ácido nucleico presentes en un ADN diana al que se unirá un segmento de direccionamiento al ADN de un ARNg, siempre que existan condiciones suficientes para la unión. El término secuencia de reconocimiento de ARN guía, como se utiliza en la presente memoria, abarca ambas cadenas del ADN diana de doble cadena (es decir, la secuencia en la cadena complementaria a la que se hibrida el ARN guía y la secuencia correspondiente en la cadena no complementaria adyacente al motivo adyacente al protoespaciador (PAM)). La expresión “ secuencia diana de ARN guía” , como se utiliza en la presente memoria, se refiere específicamente a la secuencia en la cadena no complementaria adyacente al PAM (es decir, aguas arriba o 5' del Pam). Es decir, la secuencia diana del ARN guía se refiere a la secuencia en la cadena no complementaria correspondiente a la secuencia con la que el ARN guía se hibrida en la cadena complementaria. Una secuencia diana de ARN guía es equivalente al segmento de direccionamiento a ADN de un ARN guía, pero con timinas en lugar de uracilos. Como ejemplo, una secuencia diana de ARN guía para una enzima Cas9 se referiría a la secuencia de la cadena no complementaria adyacente al PAM 5-NGG-3'. Las secuencias de reconocimiento de ARN guía incluyen secuencias a las que se diseña un ARN guía para que tengan complementariedad, donde la hibridación entre la cadena complementaria de una secuencia de reconocimiento de ARN guía y una secuencia de direccionamiento al ADN de un ARN guía promueve la formación de un complejo CRISPR. No se requiere necesariamente la complementariedad completa, siempre que haya suficiente complementariedad para provocar la hibridación y promover la formación de un complejo CRISPR. Las secuencias de reconocimiento de ARN guía o las secuencias diana de ARN guía también incluyen sitios de escisión para las proteínas Cas, descritas con más detalle a continuación. Una secuencia de reconocimiento de ARN guía o una secuencia diana de ARN guía puede comprender cualquier polinucleótido, que puede estar ubicado, por ejemplo, en el núcleo o citoplasma de una célula o dentro de un orgánulo de una célula, tal como una mitocondria o cloroplasto.
La secuencia de reconocimiento de ARN guía dentro de un ADN diana puede direccionarse a (es decir, unirse a, hibridarse con, o ser complementaria a) una proteína Cas o un ARNg. Las condiciones de unión de ADN/ARN adecuadas incluyen condiciones fisiológicas normalmente presentes en una célula. Se conocen otras condiciones de unión de ADN/ARN adecuadas (p. ej., condiciones en un sistema exento de células)(véase, p. ej.,Molecular Cloning: A Laboratory Manual, 3.a ed. (Sambrook y col., Harbor Laboratory Press 2001)). La cadena del ADN diana que es complementaria y se hibrida con la proteína Cas o el ARNg puede denominarse “ cadena complementaria” , y la cadena del ADN diana que es complementaria a la “ cadena complementaria” (y por lo tanto no es complementaria a la proteína Cas o ARNg) puede llamarse “ cadena no complementaria” o “ cadena molde” .
La proteína Cas puede escindir el ácido nucleico en un sitio dentro o fuera de la secuencia de ácido nucleico presente en el ADN diana al que se unirá el segmento de direccionamiento de ADN de un ARNg. El “sitio de escisión” incluye la posición de un ácido nucleico en el que una proteína Cas produce una ruptura monocatenaria o una ruptura de doble cadena. Por ejemplo, la formación de un complejo CRISPR (que comprende un ARNg hibridado con la cadena complementaria de una secuencia de reconocimiento de ARN guía y complejado con una proteína Cas) puede resultar en la escisión de una o ambas cadenas en o cerca (p. ej., dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 o más pares de bases) de la secuencia de ácido nucleico presente en un a Dn diana a la que se unirá un segmento de direccionamiento al ADN de un ARNg. Si el sitio de escisión está fuera de la secuencia de ácido nucleico a la que se unirá el segmento de direccionamiento al ADN del ARNg, se sigue considerando que el sitio de escisión está dentro de la “ secuencia de reconocimiento de ARN guía” o secuencia diana de ARN guía. El sitio de escisión puede estar solo en una cadena o en ambas cadenas de un ácido nucleico. Los sitios de escisión pueden estar en la misma posición en ambas cadenas del ácido nucleico (produciendo extremos romos) o pueden estar en sitios diferentes en cada cadena (produciendo extremos escalonados (es decir, extremos no pareados)). Los extremos escalonados pueden producirse, por ejemplo, mediante el uso de dos proteínas Cas, cada una de las cuales produce una ruptura de cadena única en un sitio de escisión diferente en una cadena diferente, produciendo de este modo una ruptura de doble cadena. Por ejemplo, una primera nickasa puede crear una ruptura de cadena única en la primera cadena de ADN de doble cadena (ADNbc), y una segunda nickasa puede crear una ruptura de cadena única en la segunda cadena de ADNbc de modo que se creen secuencias protuberantes. En algunos casos, la secuencia de reconocimiento de ARN guía o secuencia diana de ARN guía de la nickasa en la primera cadena está separada de la secuencia de reconocimiento de ARN guía o secuencia diana de ARN guía de la nickasa en la segunda cadena por al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 o 1000 pares de bases.
La unión y/o escisión específica del sitio del ADN diana por las proteínas Cas puede producirse en ubicaciones determinadas tanto por (i) la complementariedad de apareamiento de bases entre el ARNg y el ADN diana como por (ii) un motivo corto, denominado motivo adyacente de protoespaciador (PAM), en el ADN diana. El PAM puede flanquear la secuencia diana del ARN guía en la cadena no complementaria opuesta a la cadena con la que se híbrida el<a>R<n>guía. Opcionalmente, la secuencia diana de ARN guía puede estar flanqueada en el extremo 3' por el PAM. Alternativamente, la secuencia diana de ARN guía puede estar flanqueada en el extremo 5' por el PAM. Por ejemplo, el sitio de escisión de proteínas Cas puede estar de aproximadamente 1 a aproximadamente 10 o de aproximadamente 2 a aproximadamente 5 pares de bases (p. ej., 3 pares de bases) agua arriba o agua abajo de la secuencia PAM. En algunos casos (p. ej., cuando se utiliza Cas9 de S.pyogeneso una Cas9 estrechamente relacionada), la secuencia de Pam de la cadena no complementaria puede ser 5'-N-<i>GG-3', donde N<1>es cualquier nucleótido de ADN y está inmediatamente 3' de la secuencia de reconocimiento de ARN guía de la cadena no complementaria del ADN diana (es decir, inmediatamente 3' de la secuencia diana de ARN guía). Como tal, la secuencia PAM de la cadena complementaria sería 5'-CCN<2>-3', donde N<2>es cualquier nucleótido de ADN y está inmediatamente 5' de la secuencia de reconocimiento de ARN guía de la cadena complementaria del ADN diana. En algunos de tales casos, N<1>y N<2>pueden ser complementarios y el par de bases N<1>-N<2>puede ser cualquier par de bases (p. ej., N<1>=C y N<2>=G; N<1>=G y N<2>=C; N<1>=A y N<2>=T; o N<1>=T, y N<2>=A). En el caso de Cas9 de S.aureus,el PAM puede ser N<n>G<r>RT o N<n>GRR, donde N puede ser A, G, C o T, y R puede ser G o A. En el caso de Cas9 de C.jejuni,el PAM puede ser, p. ej., NNNNACAC o NN<n>N<r>YAC, donde N puede ser A, G, C o T, y R puede ser G o A. En algunos casos (p. ej., para FnCpfl), la secuencia de PAM puede estar aguas arriba del extremo 5' y tener la secuencia 5'-TTN-3'.
A continuación, se proporcionan ejemplos de secuencias diana de ARN guía o secuencias diana de ARN guía además de una secuencia PAM. Por ejemplo, la secuencia diana de ARN guía puede ser una secuencia de ADN de 20 nucleótidos inmediatamente anterior a un motivo NGG reconocido por una proteína Cas9. Ejemplos de tales secuencias diana de ARN guía más una secuencia PAM son GN<19>NGG (id. de sec. n.°: 9) o N<20>NGG (id. de sec. n.°: 10).Véase, p. ej.,la patente WO 2014/165825. La guanina en el extremo 5' puede facilitar la transcripción por la ARN polimerasa en las células. Otros ejemplos de secuencias diana de ARN guía más una secuencia PAM pueden incluir dos nucleótidos de guanina en el extremo 5' (p. ej., GGN<20>NGG; id. de sec. n.°: 11) para facilitar una transcripción eficaz por la polimerasa T7in vitro. Véase, p. ej.,la patente WO 2014/065596. Otras secuencias diana de ARN guía más una secuencia PAM pueden tener una longitud entre 4-22 nucleótidos de id. de sec. n.°: 9-11, que incluyen G o GG de 5' y GG o NGG de 3'. Aún otras secuencias diana de ARN guía pueden tener una longitud entre 14 y 20 nucleótidos en las id. de sec. n.°: 9-11.
La secuencia de reconocimiento del ARN guía o la secuencia diana de ARN guía puede ser cualquier secuencia de ácido nucleico endógena o exógena a una célula. La secuencia de reconocimiento de ARN guía o secuencia diana de ARN guía puede ser una secuencia que codifica un producto génico (p. ej., una proteína) o una secuencia no codificante (p. ej., una secuencia reguladora) o puede incluir ambas.
B. Animales no humanos que comprenden casetes de expresión Cas
En la presente memoria, también se describen animales no humanos que comprenden los casetes de expresión de Cas. El casete de expresión Cas está integrado de manera estable en el genoma (es decir, en un cromosoma) de la célula en el animal no humano. El casete de expresión de Cas integrado de manera estable está integrado en una región predeterminada del genoma del animal no humano (es decir, sustituido). El casete de expresión Cas está integrado de manera estable en un locus de puerto seguro. El locus genómico diana en donde el casete de expresión de Cas está integrado de manera estable puede ser heterocigoto para el casete de expresión de Cas u homocigoto para el casete de expresión de Cas. Un organismo diploide tiene dos alelos en cada locus genético. Cada par de alelos representa el genotipo de un locus genético específico. Los genotipos se describen como homocigotos si hay dos alelos idénticos en un locus particular y como heterocigotos si los dos alelos difieren.
Las células descritas en la presente memoria, que no están incluidas en la redacción de las reivindicaciones, pueden ser células de un mamífero no humano. Una célula de mamífero puede ser una célula de rata o una célula de ratón. El término “ no humano” excluye los seres humanos.
Las células también pueden estar en cualquier tipo de estado indiferenciado o diferenciado. Por ejemplo, una célula puede ser una célula totipotente, una célula pluripotente (p. ej., una célula madre embrionaria (ES) de ratón o una célula ES de rata) o una célula no pluripotente. Las células totipotentes incluyen células indiferenciadas que pueden dar lugar a cualquier tipo celular, y las células pluripotentes incluyen células indiferenciadas que poseen la capacidad de convertirse en más de un tipo celular diferenciados. Dichas células pluripotentes y/o totipotentes pueden ser, por ejemplo, células ES o células similares a ES, tales como células madre pluripotentes inducidas (iPS). Las células E<s>incluyen células totipotentes o pluripotentes derivadas de embriones que son capaces de contribuir a cualquier tejido del embrión en desarrollo al introducirse en un embrión. Las células ES pueden derivarse de la masa celular interna de un blastocisto y son capaces de diferenciarse en células de cualquiera de las tres capas germinales de vertebrados (endodermo, ectodermo y mesodermo).
Los ejemplos de células pluripotentes humanas no pertenecen a la invención, se describen solo como ejemplos e incluyen células ES humanas, células madre adultas humanas, células progenitoras humanas con desarrollo restringido y células madre pluripotentes inducidas (iPS) humanas, tales como células iPS humanas cebadas y células iPS humanas vírgenes. Las células madre pluripotentes inducidas incluyen células madre pluripotentes que pueden derivarse directamente de una célula adulta diferenciada. Las células iPS humanas pueden generarse introduciendo conjuntos específicos de factores de reprogramación en una célula que pueden incluir, p. ej., Oct3/4, factores de transcripción de la familia Sox (p. ej., Sox1, Sox2, Sox3, Sox15), factores de transcripción de la familia Myc (p. ej., c-Myc, I-Myc, n-Myc), factores de transcripción de la familia Krüppel (KLF) (p. ej., KLF1, KLF2, KLF4,<k>LF5) y/o factores de transcripción relacionados, tales como NANOG, LIN28 y/o Glis1. Las células iPS humanas también pueden generarse, por ejemplo, mediante el uso de miARN, micromoléculas que imitan las acciones de los factores de transcripción o especificadores de linaje. Las células iPS humanas se caracterizan por su capacidad para diferenciarse en cualquier célula de las tres capas germinales de los vertebrados, p. ej., el endodermo, el ectodermo o el mesodermo. Las células iPS humanas también se caracterizan por su capacidad de propagarse indefinidamente en condiciones de cultivoin vitroadecuadas.Véase, p. ej.,Takahashi y Yamanaka (2006) Cell 126:663-676. Las células ES humanas sensibilizadas y las células iPS humanas sensibilizadas incluyen células que expresan características similares a las de las células epiblásticas posteriores a la implantación y están comprometidas con la especificación y diferenciación del linaje. Las células ES humanas vírgenes y las células iPS humanas vírgenes incluyen células que expresan características similares a las de las células ES de la masa celular interior de un embrión de preimplantación y no están comprometidas para la especificación de linaje.Véase, p. ej.,Nichols y Smith (2009) Cell Stem Cell 4:487-492.
Las células descritas en la presente memoria, que no están incluidas en la redacción de las reivindicaciones, también pueden ser células germinales (p. ej., espermatozoides u ovocitos). Las células pueden ser células mitóticamente competentes o células mitóticamente inactivas, células meióticamente competentes o células meióticamente inactivas. De manera similar, las células también pueden ser células somáticas primarias o células que no son una célula somática primaria. Las células somáticas incluyen cualquier célula que no sea un gameto, una célula germinal, un gametocito o una célula madre indiferenciada. Por ejemplo, las células pueden ser células hepáticas, células renales, células hematopoyéticas, células endoteliales, células epiteliales, fibroblastos, células mesenquimales, queratinocitos, células sanguíneas, melanocitos, monocitos, células mononucleares, precursores monocíticos, células B, células eritroides-megacariocíticas, eosinófilos, macrófagos, células T, células beta de los islotes, células exocrinas, progenitores pancreáticos, progenitores endocrinos, adipocitos, preadipocitos, neuronas, células gliales, células madre neurales, neuronas, hepatoblastos, hepatocitos, cardiomiocitos, mioblastos esqueléticos, células del músculo liso, células ductales, células acinares, células alfa, células beta, células delta, celdas PP, colangiocitos, adipocitos blancos o marrones, o células oculares (p. ej., celdas de malla trabecular, células epiteliales pigmentarias de la retina, células endoteliales microvasculares de la retina, células pericitas de la retina, células epiteliales conjuntivales, fibroblastos conjuntivales, células epiteliales pigmentarias del iris, queratocitos, células epiteliales del cristalino, células epiteliales ciliares no pigmentarias, fibroblastos coroideos oculares, células fotorreceptoras, células ganglionares, células bipolares, celdas horizontales, o células amacrinas).
Las células adecuadas descritas en la presente memoria, que no están incluidas en la redacción de las reivindicaciones, incluyen las células primarias. Las células primarias incluyen células o cultivos de células que se han aislado directamente de un organismo, órgano o tejido. Las células primarias incluyen células que no se transforman ni son inmortales. Incluyen cualquier célula obtenida a partir de un organismo, órgano o tejido que no se ha pasado previamente por un cultivo de tejidos o que ha pasado previamente por un cultivo de tejidos pero que no puede pasarse indefinidamente por un cultivo de tejidos. Tales células pueden aislarse mediante técnicas convencionales e incluyen, por ejemplo, células somáticas, células hematopoyéticas, células endoteliales, células epiteliales, fibroblastos, células mesenquimales, queratinocitos, melanocitos, monocitos, células mononucleares, adipocitos, preadipocitos, neuronas, células gliales, hepatocitos, mioblastos esqueléticos y células de músculo liso. Por ejemplo, las células primarias pueden derivarse de tejidos conjuntivos, tejidos musculares, tejidos del sistema nervioso o tejidos epiteliales.
Otras células adecuadas descritas en la presente memoria, que no están incluidas en la redacción de las reivindicaciones, incluyen células inmortalizadas. Las células inmortalizadas incluyen células de un organismo multicelular que normalmente no proliferarían indefinidamente pero, debido a mutaciones o alteraciones, han evadido la senescencia celular normal y, en cambio, pueden continuar su división. Tales mutaciones o alteraciones pueden producirse naturalmente o ser inducidas intencionalmente. Los ejemplos de células inmortalizadas incluyen células de ovario de hámster chino (CHO), células de riñón embrionario humano (p. ej., células HEK 293 o células 293T) y células de fibroblastos embrionarios de ratón (p. ej., células 3T3). Son bien conocidos numerosos tipos de células inmortalizadas. Las células inmortalizadas o primarias incluyen células que se usan típicamente para cultivar o para expresar genes o proteínas recombinantes.
Las células descritas en la presente memoria, que no están incluidas en la redacción de las reivindicaciones, incluyen embriones en estadio unicelular (es decir, ovocitos o cigotos fertilizados). Dichos embriones en etapa unicelular pueden ser de cualquier fondo genético (por ejemplo, BALB/c, C57BL/6, 129 o una combinación de los mismos para ratones), pueden ser frescos o congelados, y pueden derivarse de reproducción natural o fertilizacióninvitro.
Las células proporcionadas en la presente descripción pueden ser células normales, sanas, o pueden ser células enfermas o portadoras de mutantes.
Los ratones y las ratas que comprenden un casete de expresión de Cas, como se describe en la presente memoria pueden prepararse mediante los métodos descritos en cualquier otro sitio de la presente memoria.
Los ratones y las ratas pueden ser de cualquier origen genético. Por ejemplo, los ratones adecuados pueden ser de una cepa 129, una cepa C57BL/6, una mezcla de 129 y C57BL/6, una cepa BALB/c o una cepa Swiss Webster. Los ejemplos de cepas 129 incluyen 129P1, 129P2, 129P3, 129X1, 129S1 (por ejemplo, 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1 y 129T2.Véase, p. ej.,Festing y col. (1999) Mammalian Genome 10:836. Los ejemplos de cepas C57BL incluyen C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr y C57BL/Ola. Los ratones adecuados también pueden ser de una mezcla de una cepa 129 mencionada anteriormente y una cepa C57BL/6 mencionada anteriormente (por ejemplo, 50 % 129 y 50 % C57BL/6). Igualmente, los ratones adecuados pueden ser de una mezcla de las cepas 129 mencionadas anteriormente o una mezcla de las cepas BL/6 mencionadas anteriormente (por ejemplo, la cepa 129S6 (129/SvEvTac)).
De manera similar, las ratas pueden ser de cualquier cepa de rata, lo que incluye, por ejemplo, una cepa de ratas ACI, una cepa de ratas agutí negro (DA), una cepa de ratas Wistar, una cepa de ratas LEA, una cepa de ratas Sprague Dawley (SD), o una cepa de ratas Fischer tal como Fisher F344 o Fisher F6. Las ratas también pueden obtenerse a partir de una cepa derivada de una mezcla de dos o más cepas mencionadas anteriormente. Por ejemplo, una rata adecuada puede ser de una cepa DA o una cepa ACI. La cepa de rata ACI se caracteriza por tener agutí negro, vientre y patas blancos y un haplotipoRT1av1.Tales cepas están disponibles en una variedad de fuentes, lo que incluye Harlan Laboratories. La cepa de rata Dark Agouti (DA) se caracteriza por tener un pelaje agutí y un haplotipoRT1av1.Tales ratas están disponibles en una variedad de fuentes, lo que incluye Charles River y Harlan Laboratories. En algunos casos, las ratas adecuadas pueden ser de una cepa de rata endogámica.Véase, p.ej.,la patente US-2014/0235933.
C. Loci genómicos diana
Los casetes de expresión de Cas descritos en la presente memoria están integrados genómicamente en un locus genómico diana en un animal no humano, tal como se caracteriza en las reivindicaciones.
El locus genómico diana, en el cual los casetes de expresión de Cas descritos en la presente memoria se integran de manera estable es un locus de puerto seguro en el genoma del animal no humano. Las interacciones entre el ADN exógeno integrado y el genoma huésped pueden limitar la fiabilidad y la seguridad de la integración y pueden provocar efectos fenotípicos manifiestos que no se deben a la modificación genética dirigida, sino que se deben a los efectos no deseados de la integración en los genes endógenos circundantes. Por ejemplo, los transgenes insertados aleatoriamente pueden estar sujetos a efectos de posición y silenciamiento, lo que hace que su expresión sea poco fiable e impredecible. Del mismo modo, la integración del ADN exógeno en un locus cromosómico puede afectar a los genes endógenos circundantes y a la cromatina, alterando de este modo el comportamiento y los fenotipos celulares. Los loci de puerto seguro incluyen los loci cromosómicos donde los transgenes u otros insertos de ácido nucleico exógenos pueden expresarse de manera estable y fiable en todos los tejidos de interés sin alterar abiertamente el comportamiento o el fenotipo celular (es decir, sin ningún efecto perjudicial en la célula huésped).Véase, p. ej.,Sadelain y col. (2012) Nat. Rev. Cancer 12:51-58. Opcionalmente, el locus de puerto seguro es aquel en donde la expresión de la secuencia génica insertada no se ve perturbada por ninguna expresión de lectura completa de genes adyacentes. Por ejemplo, los loci de puerto seguro pueden incluir loci cromosómicos donde el ADN exógeno puede integrarse y funcionar de manera predecible sin afectar adversamente a la estructura o expresión del gen endógeno. Los loci de puerto seguro pueden incluir regiones extragénicas o regiones intragénicas tales como, por ejemplo, loci dentro de genes que no son esenciales, prescindibles o que pueden romperse sin consecuencias fenotípicas manifiestas.
El locusRosa26y su equivalente en humanos ofrecen una configuración cromatina abierta en todos los tejidos y se expresan de forma ubicua durante el desarrollo embrionario y en adultos.Véase, p. ej.,Zambrowicz y col. (1997) Proc. Natl. Acad. Sci. USA 94:3789-3794. Además, el locusRosa26puede direccionarse con alta eficacia, y la rotura del genRosa26no produce ningún fenotipo manifiesto. Otros ejemplos de loci de puerto seguro, que sin embargo no se utilizan según la invención, incluyen CCR5, HPRT, AAVS1 y albúmina.Véase, p. ej.,las patentes US-7.888.121; US-7.972.854; US-7.914.796; US-7.951.925; US-8.110.379; US-8.409.861; US-8.586.526; y las patentes US-2005/0208489; US-2005/0026157; US-2006/0063231; US-2008/0159996; US-2010/00218264; US-2012/0017290; US-2011/0265198; US-2013/0137104; US-2013/0122591; US-2013/0177983; US-2013/0177960; y US-2013/0122591. La focalización bialélica de loci de puerto seguro como el locusRosa26no tiene consecuencias negativas, por lo que se pueden direccionar diferentes genes o indicadores a los dos alelosRosa26. Según la invención, un casete de expresión de Cas está integrado en el primer intrón del locusRosa26.
D. Animales no humanos delecionadores de recombinasa
Los animales no humanos que comprenden un casete de expresión de Cas que comprende una secuencia codificante de Cas aguas abajo de una señal de poliadenilación o un terminador de la transcripción flanqueada por sitios de reconocimiento de recombinasas reconocidos por una recombinasa específica de sitio, como se describe en la presente memoria, pueden comprender además un casete de expresión de recombinasa que impulsa la expresión de la recombinasa específica del sitio. Las recombinasas específicas de sitio incluyen enzimas que pueden facilitar la recombinación entre sitios de reconocimiento de recombinasas, donde los dos sitios de recombinación están separados físicamente dentro de un único ácido nucleico o en ácidos nucleicos separados. Los ejemplos de recombinasas incluyen las recombinasas Cre, Flp y Dre. Un ejemplo de un gen de recombinasa Cre es Crei, en el que dos exones que codifican la recombinasa Cre están separados por un intrón para evitar su expresión en una célula procariota. Dichas recombinasas pueden comprender además una señal de localización nuclear para facilitar la localización en el núcleo (por ejemplo, NLS-Crei). Los sitios de reconocimiento de recombinasa incluyen secuencias de nucleótidos que son reconocidas por una recombinasa específica de sitio y pueden servir como sustrato para un evento de recombinación. Los ejemplos de sitios de reconocimiento de recombinasa incluyen FRT, FRT11, FRT71, attp, att, rox y sitios lox tales como loxP, lox511, lox2272, lox66, lox71, loxM2 y lox5171.
El casete de expresión de Cas y el casete de expresión de recombinasa pueden integrarse en diferentes loci genómicos diana, o pueden integrarse genómicamente en el mismo locus diana (p. ej., un locusRosa26,tal como el integrado en el primer intrón del locusRosa26).Por ejemplo, la célula o el animal no humano pueden ser heterocigotos para cada uno del casete de expresión de Cas y el casete de expresión de la recombinasa, con un alelo del locus genómico diana que comprende el casete de expresión de Cas y un segundo alelo del locus genómico diana que comprende el casete de expresión del casete de expresión de la recombinasa.
El gen de la recombinasa en un casete de expresión de recombinasa puede estar unido operativamente a cualquier promotor adecuado. Los ejemplos de promotores se describen en cualquier otro sitio de la presente memoria. Por ejemplo, el promotor puede ser un promotor específico de tejido (p. ej., un promotor de albúmina para la expresión específica del hígado o un promotor de insulina 2 para la expresión específica del páncreas) o un promotor específico del estadio de desarrollo. La ventaja proporcionada por tales promotores es que la expresión de Cas puede activarse selectivamente en un tejido deseado o solo en un estadio de desarrollo deseado, reduciendo de este modo la posibilidad de toxicidad mediada por Casin vivo.Una lista no limitativa de promotores ilustrativos para cepas de deleción de recombinasa de ratón se proporciona en la tabla 2.
Tabla 2. Promotores ilustrativos utilizados en cepas delecionadoras de recombinasa de ratón.
III. Métodos para evaluar la actividad de CRISPR/Cas in vivo
Se proporcionan diversos métodos para evaluar el suministro de CRISPR/Cas y para evaluar la actividad de CRISPR/Cas en tejidos y órganos de un animal vivo, tal como se caracteriza en las reivindicaciones. Tales métodos utilizan animales no humanos que comprenden un casete de expresión de Cas como se describe en cualquier otro sitio de la presente memoria.
A. Métodos para evaluar la capacidad del CRISPR/Cas para modificar un locus genómico dianain vivoo exvivo
Se proporcionan diversos métodos para evaluar la capacidad de una nickasa o nucleasa CRISPR/Cas para modificar un locus genómico dianain vivoutilizando los animales no humanos que comprenden un casete de expresión de Cas descrito en la presente memoria. Tales métodos comprenden: (a) introducir en el animal no humano un ARN guía diseñado para dirigirse a una secuencia diana de ARN guía en el locus genómico diana; y (b) evaluar la modificación del locus diana, tal como se describe en detalle en las reivindicaciones. Se inducirá la modificación de un locus genómico diana cuando el ARN guía forme un complejo con la proteína Cas y dirija la proteína Cas al locus genómico diana, y el complejo Cas/ARN guía escinde la secuencia diana del ARN guía, desencadenando la reparación por parte de la célula (p. ej., mediante una unión de extremos no homólogos (NHEJ) si no hay presente una secuencia donante).
Opcionalmente, se pueden introducir dos o más ARN guía, cada uno diseñado para dirigirse a una secuencia diana de ARN guía diferente dentro del locus genómico diana. Por ejemplo, se pueden diseñar dos ARN guía para escindir una secuencia genómica entre las dos secuencias diana de<a>R<n>guía. Se inducirá la modificación de un locus genómico diana cuando el primer ARN guía forme un complejo con la proteína Cas y dirija la proteína Cas al locus genómico diana, el segundo ARN guía forme un complejo con la proteína Cas y dirija la proteína Cas al locus genómico diana, el primer complejo Cas/ARN guía escinde la primera secuencia diana del ARN guía y el segundo complejo Cas/ARN guía escinde la segunda secuencia diana del ARN guía, lo que resulta en la escisión de la secuencia interviniente. Alternativamente, se pueden introducir dos o más ARN guía, cada uno diseñado para dirigirse a una secuencia diana de ARN guía diferente en un locus genómico diana diferente (es decir, multiplexación).
Opcionalmente, también se introduce un ácido nucleico donante exógeno capaz de recombinarse con y modificar el locus genómico diana en el animal no humano. Opcionalmente, la proteína Cas se puede unir al ácido nucleico donante exógeno como se describe en cualquier otro sitio de la presente memoria. Opcionalmente, se introducen dos o más ácidos nucleicos donantes exógenos, cada uno capaz de recombinarse con y modificar un locus genómico diana diferente. Se inducirá la modificación del locus genómico diana, por ejemplo, cuando el ARN guía forme un complejo con la proteína Cas y dirija la proteína Cas al locus genómico diana, el complejo Cas/ARN guía escinde la secuencia diana del ARN guía y el locus genómico diana se recombina con el ácido nucleico donante exógeno para modificar el locus genómico diana. El ácido nucleico del donante exógeno puede recombinarse con el locus genómico diana, por ejemplo, mediante la reparación dirigida por homología (HDR) o mediante la inserción mediada por NHEJ. Se puede utilizar cualquier tipo de ácido nucleico donante exógeno, cuyos ejemplos se proporcionan en cualquier otro sitio de la presente memoria.
Del mismo modo, los diversos métodos proporcionados anteriormente para evaluar la actividad de CRISPR/Casin vivotambién se pueden utilizar para evaluar la actividad de CRISPR/Cas exvivousando células que comprenden un casete de expresión de Cas como se describe en cualquier otro sitio de la presente memoria.
Los ARN guía y, opcionalmente, los ácidos nucleicos donantes exógenos se introducen en el animal no humano mediante un método de suministro del AAV8 mediante el cual se direcciona al hígado.
Los métodos para evaluar la modificación del locus genómico diana se describen en cualquier otro sitio de la presente memoria y son bien conocidos. La evaluación de la modificación del locus genómico diana puede realizarse en cualquier tipo de célula, cualquier tipo de tejido o cualquier tipo de órgano, como se describe en cualquier otro sitio de la presente memoria. Según la invención, la modificación del locus genómico diana se evalúa en las células hepáticas (p. ej., evaluando los niveles séricos de una proteína secretada expresada por el locus genómico diana en las células hepáticas). Por ejemplo, el locus genómico diana comprende un gen diana, y la evaluación puede comprender medir la expresión del gen diana o la actividad de una proteína codificada por el gen diana. Alternativa o adicionalmente, la evaluación puede comprender secuenciar el locus genómico diana en una o más células aisladas del animal no humano. La evaluación puede comprender aislar un órgano o tejido diana del animal no humano y evaluar la modificación del locus genómico diana en el órgano o tejido diana. La evaluación también puede comprender evaluar la modificación del locus genómico diana en dos o más tipos de células diferentes dentro del órgano o tejido diana. Similarmente, la evaluación puede comprender aislar un órgano o tejido no diana (p. ej., dos o más órganos o tejidos no diana) del animal no humano y evaluar la modificación del locus genómico diana en el órgano o tejido no diana.
(1) Ácidos nucleicos de donantes exógenos
Los métodos descritos en la presente memoria utilizan ácidos nucleicos donantes exógenos para modificar un locus genómico diana tras la escisión del locus genómico diana con una proteína Cas. En tales métodos, la proteína Cas escinde el locus genómico diana para crear una ruptura (mella) de una sola cadena o una ruptura de doble cadena, y el ácido nucleico donante exógeno recombina el locus genómico diana mediante una ligación mediada por una unión de extremos no homólogos (NHEJ) o mediante un evento de reparación dirigido por homología. Opcionalmente, la reparación con el ácido nucleico donante exógeno elimina o rompe la secuencia diana del ARN guía o el sitio de escisión de Cas, de modo que los alelos que se han direccionado no pueden ser redirigidos por la proteína Cas.
Los ácidos nucleicos de donantes exógenos pueden comprender ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN), pueden ser monocatenario o bicatenario, y pueden tener forma lineal o circular. Por ejemplo, un ácido nucleico donante exógeno puede ser un oligodesoxinucleótido monocatenario (ssODN).Véase, p. ej.,Yoshimi y col. (2016) Nat. Commun. 7:10431. Un ácido nucleico donante exógeno ilustrativo tiene una longitud de entre aproximadamente 50 nucleótidos a aproximadamente 5 kb, una longitud de entre aproximadamente 50 nucleótidos a aproximadamente 3 kb, o una longitud de entre aproximadamente 50 a aproximadamente 1000 nucleótidos. Otros ejemplos de ácidos nucleicos donantes exógenos tienen una longitud de entre aproximadamente 40 y aproximadamente 200 nucleótidos. Por ejemplo, un ácido nucleico donante exógeno puede tener una longitud entre aproximadamente 50-60, 60-70, 70-80, 80-90, 90 100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190 o 190-200 nucleótidos. Alternativamente, un ácido nucleico donante exógeno puede tener una longitud entre aproximadamente 50-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900 o 900-1000 nucleótidos. Alternativamente, un ácido nucleico donante exógeno puede tener una longitud entre aproximadamente 1-1,5, 1,5-2, 2-2,5, 2,5-3, 3-3,5, 3,5-4, 4-4,5 o 4,5-5 kb. Alternativamente, un ácido nucleico donante exógeno puede tener, por ejemplo, una longitud no superior a 5 kb, 4,5 kb, 4 kb, 3,5 kb, 3 kb, 2,5 kb, 2 kb, 1,5 kb, 1 kb, 900 nucleótidos, 800 nucleótidos, 700 nucleótidos, 600 nucleótidos, 500 nucleótidos, 400 nucleótidos, 300 nucleótidos, 200 nucleótidos, 100 nucleótidos o 50 nucleótidos. Los ácidos nucleicos de donantes exógenos (p. ej., vectores de direccionamiento) también pueden ser más largos.
En un ejemplo, un ácido nucleico donante exógeno es un ssODN que tiene una longitud entre aproximadamente 80 nucleótidos y aproximadamente 200 nucleótidos. En otro ejemplo, un ácido nucleico donante exógeno es un ssODN que tiene una longitud entre aproximadamente 80 nucleótidos y aproximadamente 3 kb. Tal ssODN puede tener brazos de homología, por ejemplo, que tienen cada uno una longitud entre aproximadamente 40 nucleótidos y aproximadamente 60 nucleótidos. Tal ssODN también puede tener brazos de homología, por ejemplo, que tienen cada uno una longitud entre aproximadamente 30 nucleótidos y 100 nucleótidos. Los brazos de homología pueden ser simétricos (p. ej., cada 40 nucleótidos o cada 60 nucleótidos de longitud), o pueden ser asimétricos (p. ej., un brazo de homología que tiene una longitud de 36 nucleótidos y un brazo de homología que tiene una longitud de 91 nucleótidos).
Los ácidos nucleicos de donantes exógenos pueden incluir modificaciones o secuencias que proporcionan características deseables adicionales (p. ej., estabilidad modificada o regulada; seguimiento o detección con una etiqueta fluorescente; un sitio de unión para una proteína o un complejo proteico; y así sucesivamente). Los ácidos nucleicos donantes exógenos pueden comprender una o más etiquetas fluorescentes, etiquetas de purificación, etiquetas de epítopos o una combinación de las mismas. Por ejemplo, un ácido nucleico donante exógeno puede comprender uno o más marcadores fluorescentes (p. ej., proteínas fluorescentes u otros fluoróforos o colorantes), tales como al menos 1, al menos 2, al menos 3, al menos 4 o al menos 5 marcadores fluorescentes. Los marcadores fluorescentes ilustrativos incluyen fluoróforos tales como fluoresceína (p. ej., 6-carboxifluoresceína (6-FAM)), Rojo Texas, HEX, Cy3, Cy5, Cy5.5, Azul Pacífico, 5-(y-6)-carboxitetrametilrodamina (TAMRA) y Cy7. Se comercializa una amplia gama de tintes fluorescentes para etiquetar oligonucleótidos (p. ej., de Integrated DNA Technologies). Tales marcadores fluorescentes (p. ej., marcadores fluorescentes internos) se pueden utilizar, por ejemplo, para detectar un ácido nucleico donante exógeno que se ha integrado directamente en un ácido nucleico diana escindido que tiene extremos sobresalientes compatibles con los extremos del ácido nucleico donante exógeno. El marcador o etiqueta puede estar en el extremo 5', el extremo 3' o internamente dentro del ácido nucleico donante exógeno. Por ejemplo, un ácido nucleico donante exógeno puede conjugarse en el extremo 5' con el fluoróforo IR700 de Integrated d Na Technologies (5'IRDYE®700).
Los ácidos nucleicos donantes exógenos también pueden comprender insertos de ácido nucleico que incluyen segmentos de ADN que se integrarán en los loci genómicos diana. La integración de un inserto de ácido nucleico en un locus genómico diana puede dar como resultado, además de una secuencia de ácido nucleico de interés para el locus genómico diana, la deleción de una secuencia de ácido nucleico de interés en el locus genómico diana o el reemplazo de una secuencia de ácido nucleico de interés en el locus genómico diana (es decir, deleción e inserción). Algunos ácidos nucleicos donantes exógenos se diseñan para la inserción de un inserto de ácido nucleico en un locus genómico diana sin ninguna deleción correspondiente en el locus genómico diana. Otros ácidos nucleicos donantes exógenos se diseñan para eliminar una secuencia de ácido nucleico de interés en un locus genómico diana sin ninguna inserción correspondiente de un inserto de ácido nucleico. Sin embargo, otros ácidos nucleicos donantes exógenos se diseñan para eliminar una secuencia de ácido nucleico de interés en un locus genómico diana y sustituirla por un inserto de ácido nucleico.
El inserto de ácido nucleico o el ácido nucleico correspondiente en el locus genómico diana que se desea eliminar y/o reemplazar pueden tener diversas longitudes. Un inserto de ácido nucleico ilustrativo o el ácido nucleico correspondiente en el locus genómico diana que se elimina y/o reemplaza tiene una longitud de entre aproximadamente 1 nucleótido y aproximadamente 5 kb o una longitud de entre aproximadamente 1 nucleótido y aproximadamente 1000 nucleótidos. Por ejemplo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el locus genómico diana que se está eliminando y/o reemplazando puede estar entre aproximadamente 1-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70 80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150, 150-160, 160-170, 170-180, 180-190 o 190-120 nucleótidos de longitud. Del mismo modo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el locus genómico diana que se está eliminando y/o reemplazando puede tener una longitud de entre 1-100, 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900 o 900-1000 nucleótidos. Del mismo modo, un inserto de ácido nucleico o un ácido nucleico correspondiente en el locus genómico diana que se está eliminando y/o reemplazando puede tener una longitud de entre aproximadamente 1-1,5, 1,5-2, 2-2,5, 2,5-3, 3-3,5, 3,5-4, 4-4,5 o 4,5-5 kb o más.
El inserto de ácido nucleico puede comprender una secuencia que es homóloga u ortóloga a toda o parte de la secuencia diana para el reemplazo. Por ejemplo, el inserto de ácido nucleico puede comprender una secuencia que comprende una o más mutaciones puntuales (p. ej., 1, 2, 3, 4, 5 o más) en comparación con una secuencia cuya diana es el reemplazo en el locus genómico diana. Opcionalmente, tales mutaciones puntuales pueden dar como resultado una sustitución conservadora de aminoácidos (p. ej., la sustitución del ácido aspártico [Asp, D] por ácido glutámico [Glu, E]) en el polipéptido codificado.
(2) Ácidos nucleicos donantes para la inserción mediada por la unión de extremos no homólogos
Algunos ácidos nucleicos donantes exógenos tienen regiones monocatenarias en el extremo 5' y/o en el extremo 3' que son complementarias a uno o más extremos no pareados creados por la escisión mediada por la proteína Cas en el locus genómico diana. Estos extremos no pareados también pueden denominarse brazos de homología en 5' y 3'. Por ejemplo, algunos ácidos nucleicos donantes exógenos tienen regiones de cadena únicas cortas en el extremo 5' y/o en el extremo 3' que son complementarias a uno o más extremos no pareados creados por la escisión mediada por la proteína Cas en las secuencias diana 5' y/o 3' en el locus genómico diana. Algunos de tales ácidos nucleicos donantes exógenos tienen una región complementaria solo en el extremo 5' o solo en el extremo 3'. Por ejemplo, algunos de tales ácidos nucleicos donantes exógenos tienen una región complementaria solo en el extremo 5' complementaria a un extremo no pareado creado en una secuencia diana 5' en el locus genómico diana o solo en el extremo 3' complementaria a un extremo no pareado creado en una secuencia diana 3' en el locus genómico diana. Otros ácidos nucleicos donantes exógenos de este tipo tienen regiones complementarias en los extremos 5' y 3'. Por ejemplo, otros de tales ácidos nucleicos donantes exógenos tienen regiones complementarias en los extremos 5' y 3', p. ej., complementarias al primer y segundo extremos no pareados, respectivamente, generados por la escisión mediada por Cas en el locus genómico diana. Por ejemplo, si el ácido nucleico donante exógeno es de cadena doble, las regiones complementarias monocatenarias pueden extenderse desde el extremo 5 'de la cadena superior del ácido nucleico donante y el extremo 5' de la cadena inferior del ácido nucleico donante, creando protuberancias en 5' en cada extremo. Alternativamente, la región complementaria monocatenaria puede extenderse desde el extremo 3' de la cadena superior del ácido nucleico donante y desde el extremo 3' de la cadena inferior del molde, creando extremos no pareados en 3'.
Las regiones complementarias pueden tener cualquier longitud suficiente para promover la ligadura entre el ácido nucleico donante exógeno y el ácido nucleico diana. Las regiones complementarias ilustrativas tienen entre aproximadamente 1 a aproximadamente 5 nucleótidos de longitud, entre aproximadamente 1 a aproximadamente 25 nucleótidos de longitud, o entre aproximadamente 5 a aproximadamente 150 nucleótidos de longitud. Por ejemplo, una región complementaria puede tener una longitud de al menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 o 25 nucleótidos. Alternativamente, la región complementaria puede tener una longitud de aproximadamente 5-10, 10-20, 20-30, 30-40, 40-50, 50-60, 60-70, 70 80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140 o 140-150 nucleótidos, o más larga.
Tales regiones complementarias pueden ser complementarias a los extremos no pareados creados por dos pares de nickasas. Se pueden crear dos rupturas de cadena doble con extremos escalonados utilizando una primera y una segunda nickasas que escinden cadenas opuestas de ADN para crear una primera ruptura de cadena doble, y una tercera y cuarta nickasas que escinden cadenas opuestas de ADN para crear una segunda ruptura de cadena doble. Por ejemplo, una proteína Cas se puede utilizar para mellar la primera, segunda, tercera y cuarta secuencias diana de ARN guía correspondientes al primer, segundo, tercer y cuarto ARN guía. La primera y la segunda secuencias diana del ARN guía pueden colocarse para crear un primer sitio de escisión, de tal modo que las muescas creadas por la primera y la segunda nickasas en la primera y la segunda cadenas de ADN creen una ruptura de cadena doble (es decir, el primer sitio de escisión comprende las muescas dentro de la primera y la segunda secuencias diana del ARN guía). Del mismo modo, las secuencias diana del ARN guía tercera y cuarta pueden colocarse para crear un segundo sitio de escisión, de tal modo que las mellas creadas por las nickasas tercera y cuarta en la primera y la segunda cadenas de ADN creen una ruptura de cadena doble (es decir, el segundo sitio de escisión comprende las muescas dentro de la tercera y cuarta secuencias diana del ARN guía). Opcionalmente, las muescas dentro de la primera y segunda secuencias diana de ARN guía y/o la tercera y cuarta secuencias diana de ARN guía pueden ser muescas desplazadas que crean extremos no pareados. La ventana de desplazamiento puede ser, por ejemplo, de al menos aproximadamente 5 bp, 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp, 100 bp o más.VéaseRan y col. (2013) Cell 154:1380-1389; Mali y col. (2013) Nat. Biotech.31:833-838; y Shen y col. (2014) Nat. Methods 11:399-404. En tales casos, un ácido nucleico donante exógeno bicatenario puede diseñarse con regiones complementarias monocatenario que son complementarias a los extremos no pareados creados por las muescas dentro de la primera y segunda secuencias diana de ARN guía y por las muescas dentro de la tercera y cuarta secuencias diana de ARN guía. A continuación, tal ácido nucleico donante exógeno puede insertarse mediante ligación mediada por unión de extremos no homólogos.
(3) Ácidos nucleicos de donantes para su inserción mediante reparación dirigida mediante homología
Algunos ácidos nucleicos donantes exógenos comprenden brazos de homología. Si el ácido nucleico donante exógeno también comprende un inserto de ácido nucleico, los brazos de homología pueden flanquear el inserto de ácido nucleico. Para facilitar la referencia, los brazos de homología se denominan en la presente memoria como brazos de homología 5' y 3' (es decir, corriente arriba y corriente abajo). Esta terminología se refiere a la posición relativa de los brazos de homología con respecto al inserto de ácido nucleico dentro del ácido nucleico donante exógeno. Los brazos de homología 5' y 3' corresponden a regiones dentro del locus genómico diana, que se denominan en la presente memoria “ secuencia diana 5'” y “ secuencia diana 3'” , respectivamente.
Un brazo de homología y una secuencia diana “ corresponden” o “ se corresponden” entre sí cuando las dos regiones comparten un nivel suficiente de identidad de secuencia entre sí para actuar como sustratos para una reacción de recombinación homóloga. El término “ homología” incluye secuencias de ADN que son idénticas o comparten identidad de secuencia con una secuencia correspondiente. La identidad de secuencia entre una secuencia diana dada y el brazo de homología correspondiente que se encuentra en el ácido nucleico donante exógeno puede ser cualquier grado de identidad de secuencia que permita que se produzca la recombinación homóloga. Por ejemplo, la cantidad de identidad de secuencia compartida por el brazo de homología del ácido nucleico donante exógeno (o un fragmento del mismo) y la secuencia diana (o un fragmento de la misma) puede ser al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia, de tal modo que las secuencias experimentan una recombinación homóloga. Además, una región de homología correspondiente entre el brazo de homología y la secuencia diana correspondiente puede tener cualquier longitud que sea suficiente para promover la recombinación homóloga. Los brazos de homología ilustrativos pueden tener una longitud entre aproximadamente 25 nucleótidos a aproximadamente 2,5 kb, una longitud entre aproximadamente 25 nucleótidos a aproximadamente 1,5 kb, o una longitud entre aproximadamente 25 a aproximadamente 500 nucleótidos. Por ejemplo, un brazo de homología dado (o cada uno de los brazos de homología) y/o la secuencia diana correspondiente pueden comprender regiones correspondientes de homología que tienen una longitud entre aproximadamente 25-30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150, 150-200, 200-250, 250-300, 300-350, 350-400, 400-450 o 450-500 nucleótidos de longitud, de tal modo que los brazos de homología tienen suficiente homología para someterse a una recombinación homóloga con las secuencias diana correspondientes dentro del ácido nucleico diana. Alternativamente, un brazo de homología dado (o cada brazo de homología) y/o la secuencia diana correspondiente pueden comprender regiones de homología correspondientes que tienen una longitud de entre aproximadamente 0,5 kb y aproximadamente 1 kb, aproximadamente 1 kb y aproximadamente 1,5 kb, aproximadamente 1,5 kb y aproximadamente 2 kb, o aproximadamente 2 kb a aproximadamente 2,5 kb. Por ejemplo, los brazos de homología pueden tener cada uno una longitud de aproximadamente 750 nucleótidos. Los brazos de homología pueden ser simétricos (cada uno aproximadamente del mismo tamaño en longitud), o pueden ser asimétricos (uno más largo que el otro).
Cuando se utiliza un sistema CRISPR/Cas en combinación con un ácido nucleico donante exógeno, las secuencias diana 5' y 3' se encuentran opcionalmente lo suficientemente cerca del sitio de escisión de Cas (p. ej., lo suficientemente cerca de la secuencia diana del ARN guía) como para promover la aparición de un evento de recombinación homóloga entre las secuencias diana y los brazos de homología tras una ruptura (mella) de una sola cadena o una ruptura de doble cadena en el sitio de escisión de Cas. El término “ sitio de escisión de Cas” incluye una secuencia de ADN en la que se crea una mella o ruptura de doble cadena mediante una enzima Cas (p. ej., una proteína Cas9 complejada con un ARN guía). Las secuencias diana dentro del locus diana que corresponden a los brazos de homología 5' y 3' del ácido nucleico donante exógeno están “ ubicadas lo suficientemente cerca” de un sitio de escisión de Cas si la distancia es tal que promueve la aparición de un evento de recombinación homóloga entre las secuencias diana 5' y 3' y los brazos de homología tras una ruptura de cadena única o una ruptura de cadena doble en el sitio de escisión de Cas. Por lo tanto, las secuencias diana correspondientes a los brazos de homología 5' y/o 3' del ácido nucleico donante exógeno pueden estar, por ejemplo, dentro de al menos 1 nucleótido de un sitio de escisión de Cas dado o dentro de al menos 10 nucleótidos a aproximadamente 1000 nucleótidos de un sitio de escisión de Cas dado. Como ejemplo, el sitio de escisión de Cas puede estar inmediatamente adyacente a al menos una o ambas secuencias diana.
La relación espacial de las secuencias diana que corresponden a los brazos de homología del ácido nucleico donante exógeno y el sitio de escisión de Cas puede variar. Por ejemplo, las secuencias diana pueden estar ubicadas a 5' con respecto al sitio de escisión de Cas, las secuencias diana pueden estar ubicadas 3' con respecto al sitio de escisión de Cas, o las secuencias diana pueden flanquear el sitio de escisión de Cas.
B. Métodos para optimizar la capacidad del CRISPR/Cas para extirpar un ácido nucleico genómico diana¡n vivoo exvivo
Se proporcionan diversos métodos para optimizar el suministro de CRISPR/Cas a un animal no humano u optimizar la actividad de CRISPR/Cas in vivo. Tales métodos pueden comprender, por ejemplo: (a) realizar el método de ensayo de la capacidad del CRISPR/Cas para modificar un locus genómico diana, según se ha descrito anteriormente, por primera vez en un primer animal no humano; (b) cambiar una variable y realizar el método por segunda vez en un segundo animal no humano (es decir, de la misma especie) con la variable cambiada; y (c) comparar la modificación del locus genómico diana en el paso (a) con la modificación del locus genómico diana en el paso (b), y seleccionar el método que da como resultado la modificación más eficaz del locus genómico diana, en donde el primer y segundo animal no humano es un ratón o una rata.
Una modificación más eficaz del locus genómico diana puede significar cosas diferentes dependiendo del efecto deseado en el animal no humano. Por ejemplo, una modificación más eficaz del locus genómico diana puede significar uno o más o todos de mayor eficacia, mayor precisión, mayor consistencia o mayor especificidad. Una mayor eficacia se refiere a niveles más altos de modificación del locus genómico diana (p. ej., un mayor porcentaje de células se direcciona a un tipo de célula diana particular, dentro de un tejido diana particular o dentro de un órgano diana particular). Una mayor precisión se refiere a una modificación más precisa del locus genómico diana (p. ej., un mayor porcentaje de células diana que tienen la misma modificación o que tienen la modificación deseada sin inserciones y deleciones adicionales no deseadas (p. ej., indeles NHEJ)). Una mayor consistencia se refiere a una modificación más consistente del locus genómico diana entre diferentes tipos de células, tejidos u órganos diana si se dirige a más de un tipo de célula, tejido u órgano (p. ej., modificación de un mayor número de tipos de células dentro de un órgano diana). Si se direcciona a un órgano en particular, una mayor consistencia también puede referirse a una modificación más consistente en todas las ubicaciones dentro del órgano. Una mayor especificidad puede referirse a una mayor especificidad con respecto al locus o loci genómico diana, una mayor especificidad con respecto al tipo de célula diana, una mayor especificidad con respecto al tipo de tejido diana o una mayor especificidad con respecto al órgano diana. Por ejemplo, el aumento de la especificidad del locus genómico se refiere a una menor modificación de los loci genómicos inespecíficos (p. ej., un menor porcentaje de células diana que tienen modificaciones en loci genómicos inespecíficos no deseados en lugar de o además de la modificación del locus genómico diana). Del mismo modo, el aumento de la especificidad del tipo de célula, tejido u órgano se refiere a una menor modificación de los tipos de células, tipos de tejidos o tipos de órganos inespecíficos si se direcciona a un tipo de célula, tipo de tejido o tipo de órgano en particular (p. ej., cuando se dirige a un órgano en particular (p. ej., el hígado), hay menos modificación de células en órganos o tejidos que no son dianas previstas).
La variable que se cambia puede ser cualquier parámetro tal como se caracteriza en las reivindicaciones.
Como ejemplo, la variable cambiada puede ser la concentración o cantidad de uno o más o todos los ARN guía (p. ej., empaquetados en AAV) introducidos y el ácido nucleico donante exógeno introducido. Como otro ejemplo, la variable cambiada puede ser la concentración o la cantidad de ARN guía (p. ej., empaquetado en AAV) introducido en relación con la concentración o la cantidad de ácido nucleico donante exógeno introducido.
Como otro ejemplo, la variable cambiada puede ser el momento de introducir uno o más o todos los ARN guía (p. ej., empaquetados en AAV) y el ácido nucleico donante exógeno en relación con el tiempo de medición de la expresión o la actividad de una o más proteínas indicadoras. Como otro ejemplo, la variable cambiada puede ser el número de veces o la frecuencia con la que se introducen uno o más o todos los ARN guía (p. ej., empaquetados en AAV) y el ácido nucleico donante exógeno. Como otro ejemplo, la variable cambiada puede ser el tiempo de introducción del ARN guía en relación con el momento de introducción del ácido nucleico donante exógeno.
Como otro ejemplo, la variable cambiada puede ser la forma en la que se introducen uno o más o todos los ARN guía y el ácido nucleico donante exógeno. Por ejemplo, el ARN guía se puede introducir en forma de ADN o en forma de ARN. El ácido nucleico donante exógeno puede ser ADN, ARN, monocatenario, bicatenario, lineal, circular, etc. Similarmente, cada uno de los componentes puede comprender varias combinaciones de modificaciones para la estabilidad, para reducir los efectos fuera del diana, para facilitar el suministro, etc. Como otro ejemplo, la variable cambiada puede ser uno o más o todos los ARN guía que se introducen (p. ej., introducir un ARN guía diferente con una secuencia diferente) y el ácido nucleico donante exógeno que se introduce (p. ej., introducir un ácido nucleico donante exógeno diferente con una secuencia diferente).
C. Introducción de los ARN guía y otros componentes en animales no humanos
Los métodos descritos en la presente memoria comprenden introducir en un animal no humano uno o más o todos los ARN guía tal como se caracterizan en las reivindicaciones y los ácidos nucleicos donantes exógenos. “ Introducir” incluye presentar al animal no humano el ácido nucleico o la proteína de tal manera que el ácido nucleico o la proteína acceda al interior de las células del animal no humano. La introducción se puede lograr por cualquier medio, y dos o más de los componentes (p. ej., dos de los componentes, o todos los componentes) se pueden introducir en el animal no humano de forma simultánea o secuencial en cualquier combinación. Por ejemplo, un ácido nucleico donante exógeno puede introducirse en un animal no humano antes de la introducción de un ARN guía, o puede introducirse después de la introducción del ARN guía (p. ej., el ácido nucleico donante exógeno puede administrarse aproximadamente 1,2, 3, 4, 8, 12, 24, 36, 48 o 72 horas antes o después de la introducción del ARN guía).Véase, p. ej.,las patentes US-2015/0240263 y US-2015/0110762. Además, dos o más de los componentes pueden introducirse en el animal no humano mediante el mismo método de suministro o diferentes métodos de suministro. De manera similar, dos o más de los componentes pueden introducirse en un animal no humano por la misma vía de suministro o por diferentes vías de suministro.
La redacción de las reivindicaciones no abarca un ARN guía introducido en la célula en forma de un ARN (p. ej., ARN transcritoin vitro)o en forma de un ADN que codifica el ARN guía. Cuando se introduce en forma de un ADN, el ADN que codifica un ARN guía puede estar unido operativamente a un promotor activo en la célula. Por ejemplo, un ARN guía puede suministrarse mediante AAV y expresarsein vivocon un promotor U6. Tales ADN pueden estar en uno o más constructos de expresión. Por ejemplo, tales constructos de expresión pueden ser componentes de una única molécula de ácido nucleico. Alternativamente, se pueden separar en cualquier combinación entre dos o más moléculas de ácido nucleico (es decir, los ADN que codifican uno o más ARN CRISPR y los ADN que codifican uno o más ARNtracr pueden ser componentes de una molécula de ácido nucleico separada).
Los ácidos nucleicos que codifican los ARN guía pueden estar unidos operativamente a un promotor en un constructo de expresión. Los constructos de expresión incluyen cualquier constructo de ácido nucleico capaz de dirigir la expresión de un gen u otra secuencia de ácido nucleico de interés y que puede transferir dicha secuencia de ácido nucleico de interés a una célula diana. Los promotores adecuados que pueden utilizarse en un constructo de expresión incluyen promotores activos, por ejemplo, en una o más de una célula eucariota, una célula humana, una célula no humana, una célula de mamífero, una célula de mamífero no humano, una célula de roedor, una célula de ratón, una célula de rata, una célula de hámster, una célula de conejo, una célula pluripotente, una célula madre embrionaria (ES), una célula madre adulta, una célula progenitora con desarrollo restringido, una célula madre pluripotente inducida (iPS) o un embrión en estadio unicelular. Tales promotores pueden ser, por ejemplo, promotores condicionales, promotores inducibles, promotores constitutivos o promotores específicos de tejido. Opcionalmente, el promotor puede ser un promotor bidireccional que dirige la expresión de un ARN guía en una dirección y otro componente en la otra dirección. Tales promotores bidireccionales pueden consistir en (1) un promotor Pol III completo, convencional y unidireccional que contiene 3 elementos de control externos: un elemento de secuencia distal (DSE), un elemento de secuencia proximal (PSE) y una caja TATA; y (2) un segundo promotor Pol III básico que incluye un PSE y una caja TATA fusionados al extremo 5' del DSE en orientación inversa. Por ejemplo, en el promotor H1, el DSE es adyacente a la caja PSE y TATA, y el promotor puede hacerse bidireccional creando un promotor híbrido en el que la transcripción en la dirección inversa se controla añadiendo una caja PSE y TATA derivada del promotor U6.Véase, p. ej.,la patente US-2016/0074535. La utilización de un promotor bidireccional para expresar genes que codifican un ARN guía y otro componente simultáneamente permite la generación de casetes de expresión compactos para facilitar el suministro.
Los ácidos nucleicos donantes exógenos y los ARN guía (o los ácidos nucleicos que codifican los ARN guía) pueden proporcionarse en composiciones que comprenden un portador que aumenta la estabilidad del ácido nucleico o ARN guía del donante exógeno (p. ej., prolongando el período en determinadas condiciones de almacenamiento (p. ej., -20 °C, 4 °C o temperatura ambiente) para las que los productos de degradación permanecen por debajo de un umbral, p. ej., por debajo del 0,5 % en peso del ácido nucleico o proteína de partida; o aumentar la estabilidad in vivo). Los ejemplos no limitativos de tales portadores incluyen microesferas de poli (ácido láctico) (PLA), microesferas de poli (D,L-ácido lácticocoglicólico) (PLGA), liposomas, micelas, micelas inversas, cocleatos lipídicos y microtúbulos lipídicos.
En la presente memoria se describen diversos métodos y composiciones para permitir la introducción de un ácido nucleico o una proteína en un animal no humano. Los métodos para introducir ácidos nucleicos en diversos tipos celulares son conocidos en la técnica e incluyen, por ejemplo, métodos de transfección estables, métodos de transfección transitoria y métodos mediados por virus.
Los protocolos de transfección, así como los protocolos para introducir secuencias de ácidos nucleicos en las células, que no están incluidos en la redacción de las reivindicaciones, pueden variar. Los métodos de transfección no limitativos incluyen métodos de transfección basados en productos químicos que usan liposomas; nanopartículas; fosfato de calcio (Graham y col. (1973) Virology 52 (2): 456-67, Bacchetti y col. (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590-4, y Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. Nueva York: W. H. Freeman and Company. págs. 96-97); dendrímeros; o polímeros catiónicos tales como DEAE-dextrano o polietilenimina. Los métodos no químicos incluyen la electroporación, la sonoporación y la transfección óptica. La transfección basada en partículas incluye el uso de una pistola genética o la transfección asistida por imanes (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). También se pueden usar métodos virales para la transfección.
La introducción de ácidos nucleicos o proteínas en una célula también puede estar mediada por electroporación, por inyección intracitoplasmática, por infección viral, por adenovirus, por virus adenoasociados, por lentivirus, por retrovirus, por transfección, por transfección mediada por lípidos o por nucleofección. La nucleofección es una tecnología de electroporación mejorada que permite que los sustratos de ácido nucleico se entreguen no solo al citoplasma sino también a través de la membrana nuclear y al núcleo. Además, la utilización de la nucleofección en los métodos divulgados en este documento normalmente requiere muchas menos células que la electroporación regular (p. ej., solo aproximadamente 2 millones en comparación con los 7 millones de la electroporación regular). En un ejemplo, la nucleofección se realiza utilizando el sistema LONZA® NUCLEOFECTOR™.
La introducción de ácidos nucleicos o proteínas en una célula (p. ej., un cigoto), que no está incluida en la redacción de las reivindicaciones, también se puede lograr mediante microinyección. En los cigotos (es decir, embriones en estadio unicelular), la microinyección puede ser en el pronúcleo materno y/o paterno o en el citoplasma. Si la microinyección se realiza en un solo pronúcleo, es preferible el pronúcleo paterno debido a su mayor tamaño. Alternativamente, la microinyección se puede llevar a cabo mediante inyección tanto en el núcleo/pronúcleo como en el citoplasma: primero se puede introducir una aguja en el núcleo/pronúcleo y se puede inyectar una primera cantidad, y mientras se retira la aguja del embrión en estadio unicelular, se puede inyectar una segunda cantidad en el citoplasma. Los métodos para llevar a cabo la microinyección son bien conocidos.Véase, p. ej.,Nagy ycol.(Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press);véase tambiénMeyer y col. (2010) Proc. Natl. Acad. Sci. USA 107:15022-15026 y Meyer y col. (2012) Proc. Natl. Acad. Sci. USA 109:9354-9359.
Otros métodos para introducir ácidos nucleicos o proteínas en una célula o un animal no humano, que no están incluidos en la redacción de las reivindicaciones, pueden incluir, por ejemplo, el suministro por vectores, el suministro mediado por partículas, el suministro mediado por exosomas, el suministro mediado por nanopartículas lipídicas, el suministro mediado por péptidos que penetran en las células o el suministro mediado por dispositivos implantables. Como ejemplos específicos, un ácido nucleico o proteína puede introducirse en una célula o animal no humano en un portador tal como una microesfera de poli(ácido láctico) (Pla), una microesfera de poli(ácido D, L-láctico-coglicólico) (PLGA), un liposoma, una micela, una micela inversa, un cocleato lipídico o un microtúbulo lipídico. Algunos ejemplos específicos de suministro a un animal no humano incluyen el suministro hidrodinámico, el suministro mediado por virus (p. ej., el suministro mediado por virus adenoasociados (AAV)) y el suministro mediado por nanopartículas lipídicas.
La introducción de ácidos nucleicos y proteínas en células o animales no humanos, que no está incluida en la redacción de las reivindicaciones, se puede lograr mediante suministro hidrodinámico (HDD). El suministro hidrodinámico ha surgido como un método para el suministro intracelular de ADNinvivo. Para el suministro de genes a las células parenquimatosas, solo es necesario inyectar las secuencias de ADN esenciales a través de un vaso sanguíneo seleccionado, lo que elimina los problemas de seguridad asociados con los vectores virales y sintéticos actuales. Cuando se inyecta en el torrente sanguíneo, el ADN es capaz de llegar a las células de los diferentes tejidos accesibles a la sangre. El suministro hidrodinámico emplea la fuerza generada por la inyección rápida de un gran volumen de solución en la sangre incompresible de la circulación para superar las barreras físicas del endotelio y las membranas celulares que impiden que los compuestos grandes e impermeables a las membranas entren en las células parenquimatosas. Además del suministro de ADN, este método es útil para el suministro intracelular eficiente de ARN, proteínas y otros compuestos pequeñosin vivo. Véase, p. ej.,Bonamassa y col. (2011) Pharm. Res. 28(4):694-701.
La introducción de ácidos nucleicos se logra mediante suministro mediado por virus, es decir, suministro mediado por AAV8. Otros virus/vectores virales ilustrativos incluyen retrovirus, adenovirus, virus vaccinia, poxvirus, y virus del herpes simple. Los virus pueden infectar células en división, células que no se dividen o células en división y células que no se dividen. Los virus pueden integrarse en el genoma del huésped o, alternativamente, no integrarse en el genoma del huésped. Tales virus también pueden modificarse por ingeniería genética para que tengan una inmunidad reducida. Los virus pueden ser competentes para la replicación o pueden ser defectuosos para la replicación (p. ej., defectuosos en uno o más genes necesarios para rondas adicionales de replicación y/o empaquetamiento del virión). Los virus pueden provocar una expresión transitoria, una expresión duradera (p. ej., al menos 1 semana, 2 semanas, 1 mes, 2 meses o 3 meses) o una expresión permanente (p. ej., de Cas9 y/o ARNg). Los títulos virales ilustrativos (p. ej., títulos de AAV) incluyen 1012, 1013, 1014, 1015 y 1016 genomas de vectores/ml.
El genoma del ADNmc AAV consiste en dos marcos de lectura abiertos, Rep y Cap, flanqueados por dos repeticiones terminales invertidas que permiten la síntesis de la cadena de ADN complementaria. Cuando se construye un plásmido de transferencia de AAV, el transgén se coloca entre los dos ITR, y Rep y Cap se pueden suministraren trans.Además de Rep y Cap, el AAV puede requerir un plásmido auxiliar que contenga genes del adenovirus. Estos genes (E4, E2a y VA) mediaron la replicación del AAV. Por ejemplo, el plásmido de transferencia, Rep/Cap, y el plásmido auxiliar pueden transfectarse en células HEK293 que contienen el gen E1+ del adenovirus para producir partículas de AAV infecciosas. Alternativamente, los genes auxiliares Rep, Cap y adenovirus pueden combinarse en un único plásmido. Se pueden utilizar células y métodos de empaquetamiento similares para otros virus, tales como los retrovirus.
Se han identificado múltiples serotipos de AAV. Estos serotipos difieren en los tipos de células que infectan (es decir, su tropismo), lo que permite la transducción preferencial de tipos celulares específicos. Los serotipos para el tejido del s Nc incluyen AAV1, AAV2, AAV4, AAV5, AAV8 y AAV9. Los serotipos para el tejido cardíaco incluyen AAV1, AAV8 y AAV9. Los serotipos para el tejido renal incluyen AAV2. Los serotipos para el tejido pulmonar incluyen AAV4, AAV5, AAV6 y AAV9. Los serotipos para el tejido pancreático incluyen AAV8. Los serotipos para las células fotorreceptoras incluyen AAV2, AAV5 y AAV8. Los serotipos para el tejido del epitelio pigmentario retiniano incluyen AAV1,<a>A<v>2, AAV4, AAV5 y AAV8. Los serotipos para el tejido muscular esquelético incluyen AAV1, AAV6, AAV7, AAV8 y AAV9. Los serotipos para el tejido hepático incluyen AAV7, AAV8 y AAV9, y particularmente AAV8.
El tropismo se puede refinar además mediante el seudotipado, que es la mezcla de una cápside y un genoma de diferentes serotipos virales. Por ejemplo, el AAV2/5 indica un virus que contiene el genoma del serotipo 2 empaquetado en la cápside del serotipo 5. La utilización de virus pseudotipados puede mejorar la eficiencia de la transducción, así como alterar el tropismo. Las cápsides híbridas derivadas de diferentes serotipos también pueden utilizarse para alterar el tropismo viral. Por ejemplo, el AAV-DJ contiene una cápside híbrida de ocho serotipos y muestra una alta infectividad en una amplia gama de tipos de célulasin vivo.El AAV-DJ8 es otro ejemplo que muestra las propiedades de AAV-DJ pero con una captación cerebral mejorada. Los serotipos de AAV también se pueden modificar mediante mutaciones. Los ejemplos de modificaciones mutacionales de AAV2 incluyen Y444F, Y500F, Y730F y S662V. Los ejemplos de modificaciones mutacionales de AAV3 incluyen Y705F, Y731F y T492V. Los ejemplos de modificaciones mutacionales de AAV6 incluyen S663V y T492V. Otras variantes de AAV pseudotipadas/modificadas incluyen AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5, AAV8.2, y AAV/SASTG.
Para acelerar la expresión del transgén, se pueden utilizar variantes de AAV autocomplementarias (scAAV, por sus siglas en inglés). Debido a que el AAV depende de la maquinaria de replicación del ADN de la célula para sintetizar la cadena complementaria del genoma del ADN monocatenario del AAV, la expresión del transgén puede retrasarse. Para abordar este retraso, se pueden utilizar secuencias complementarias que contienen scAAV que son capaces de hibridarse espontáneamente tras la infección, eliminando el requisito de síntesis de ADN de la célula huésped. Sin embargo, también se pueden utilizar vectores AAV monocatenarios (ssAAV, por sus siglas en inglés).
Para aumentar la capacidad de empaquetamiento, los transgenes más largos pueden dividirse entre dos plásmidos de transferencia de AAV, el primero con un donante de empalme en 3' y el segundo con un aceptor de empalme en 5'. T ras la coinfección de una célula, estos virus forman concatémeros, se empalman y se puede expresar el transgén de longitud completa. Aunque esto permite una expresión transgénica más prolongada, la expresión es menos eficiente. Métodos similares para aumentar la capacidad utilizan la recombinación homóloga. Por ejemplo, un transgén puede dividirse entre dos plásmidos de transferencia, pero con una superposición sustancial de secuencias de tal modo que la coexpresión induzca la recombinación homóloga y la expresión del transgén de longitud completa.
La introducción de ácidos nucleicos y proteínas también se puede lograr mediante el suministro mediado por nanopartículas lipídicas (LNP), lo que no está incluido en la redacción de las reivindicaciones. El suministro a través de tales métodos da como resultado la presencia transitoria del ARN guía, y los lípidos biodegradables mejoran la eliminación, mejoran la tolerabilidad y disminuyen la inmunogenicidad. Las formulaciones lipídicas pueden proteger las moléculas biológicas de la degradación y, al mismo tiempo, mejorar su absorción celular. Las nanopartículas lipídicas son partículas que comprenden una pluralidad de moléculas lipídicas asociadas físicamente entre sí por fuerzas intermoleculares. Estas incluyen microesferas (incluidas vesículas unilaminares y multilaminares, p. ej., liposomas), una fase dispersa en una emulsión, micelas o una fase interna en una suspensión. Tales nanopartículas lipídicas se pueden utilizar para encapsular uno o más ácidos nucleicos o proteínas para su administración. Las formulaciones que contienen lípidos catiónicos son útiles para suministrar polianiones tales como ácidos nucleicos. Otros lípidos que se pueden incluir son los lípidos neutros (es decir, los lípidos sin carga o zwitteriónicos), los lípidos aniónicos, los lípidos auxiliares que mejoran la transfección y los lípidos sigilosos que aumentan el tiempo durante el cual las nanopartículas pueden existirin vivo.En la patente WO 2016/010840 A1 se pueden encontrar ejemplos de lípidos catiónicos, lípidos neutros, lípidos aniónicos, lípidos auxiliares y lípidos ocultos adecuados. Una nanopartícula lipídica ilustrativa puede comprender un lípido catiónico y uno o más componentes adicionales. En un ejemplo, el otro componente puede comprender un lípido auxiliar tal como el colesterol. En otro ejemplo, los otros componentes pueden comprender un lípido auxiliar tal como el colesterol y un lípido neutro tal como el DSPC. En otro ejemplo, los otros componentes pueden comprender un lípido auxiliar tal como el colesterol, un lípido neutro opcional tal como el DSPC y un lípido sigiloso tal como S010, S024, S027, S031 o S033.
La LNP puede contener uno o más o todos los siguientes: (i) un lípido para la encapsulación y para el escape endosómico; (ii) un lípido neutro para la estabilización; (iii) un lípido auxiliar para la estabilización; y (iv) un lípido sigiloso.Véase, p. ej.,Finn y col. (2018) Cell Reports 22:1-9 y la patente WO 2017/173054 A1. En ciertas Ln P, la carga puede incluir un ARN guía o un ácido nucleico que codifica un ARN guía. En ciertas LNP, la carga puede incluir un ARN guía o un ácido nucleico que codifica un ARN guía y un ácido nucleico donante exógeno.
El lípido para la encapsulación y el escape endosómico puede ser un lípido catiónico. El lípido también puede ser un lípido biodegradable, tal como un lípido ionizable biodegradable. Un ejemplo de lípido adecuado es el lípido A o LP01, que es (9Z,12Z)-3-((4,4-bis(octiloxi)butanoil)oxi)-2-((((3-(dietilamino)propoxi)carbonil)oxi)metil)propilo octadeca-9,12-dienoato, también llamado 3-((4,4-bis(octiloxi)butanoil)oxi)-2-((((3-(dietilamino)propoxi)carbonil)oxi)metil)propilo (9Z,12Z)-octadeca-9,12-dienoato.Véase, p. ej,Finn y col. (2018) Cell Reports 22:1-9 y la patente WO 2017/173054 A1. Otro ejemplo de un lípido adecuado es el lípido B, que es ((5-((dimetilamino)metil)-1,3-fenileno)bis(oxi))bis(octano-8,1-diil)bis(decanoato), también llamado ((5-((dimetilamino)metil)-1,3-fenileno)bis(oxi))bis(octano-8,1-diil)bis(decanoato). Otro ejemplo de un lípido adecuado es el lípido C, que es 2-((4-(((3-(dimetilamino)propoxi)carbonil)oxi)hexadecanoil)oxi)propano-1,3-diil(9Z,9'Z,12Z,12'Z)-bis(octadeca-9,12-dienoato). Otro ejemplo de un lípido adecuado es el lípido D, que es 3-(((3-(dimetilamino)propoxi)carbonil)oxi)-13-(octanoiloxi)tridecilo 3-octilundecanoato. Otros lípidos adecuados incluyen heptatriaconta-6,9,28,31-tetraen-19-il 4-(dimetilamino)butanoato (también conocido como Dlin-MC3-DMA (MC3)).
Algunos de estos lípidos adecuados para utilizarse en las LNP descritas en la presente memoria son biodegradablesinvivo. Por ejemplo, las LNP que comprenden tal lípido incluyen aquellos en los que al menos el 75 % del lípido se elimina del plasma en 8, 10, 12, 24 o 48 horas, o 3, 4, 5, 6, 7 o 10 días. Como otro ejemplo, al menos el 50 % de la LNP se elimina del plasma en 8, 10, 12, 24 o 48 horas, o en 3, 4, 5, 6, 7 o 10 días.
Tales lípidos pueden ser ionizables dependiendo del pH del medio en el que se encuentren. Por ejemplo, en un medio ligeramente ácido, los lípidos pueden protonarse y, por lo tanto, tener una carga positiva. Por el contrario, en un medio ligeramente básico, tales como, por ejemplo, la sangre con un pH de aproximadamente 7,35, es posible que los lípidos no estén protonados y, por lo tanto, no tengan carga. En algunas realizaciones, los lípidos pueden protonarse a un pH de al menos aproximadamente 9, 9,5 o 10. La capacidad de tal lípido para soportar una carga está relacionada con su pKa intrínseco. Por ejemplo, el lípido puede, independientemente, tener un pKa en el intervalo de aproximadamente 5,8 a aproximadamente 6,2.
Los lípidos neutros funcionan para estabilizar y mejorar el procesamiento de las LNP. Los ejemplos de lípidos neutros adecuados incluyen una variedad de lípidos neutros, sin carga o zwitteriónicos. Los ejemplos de fosfolípidos neutros adecuados para utilizarse en la presente descripción incluyen, pero no se limitan a, 5-heptadecilbenceno-1,3-diol (resorcinol), dipalmitoilfosfatidilcolina (DPPC), diestearoilfosfatidilcolina (DSPC), fosfocolina (DOPC), dimiristoilfosfatidilcolina (DMPC), fosfatidilcolina (PLPC), 1,2-diestearoil-sn-glicero-3-fosfocolina (DAPC), fosfatidiletanolamina (PE), fosfatidilcolina de huevo (EPC), dilauriloilfosfatidilcolina (DLPC), dimiristoilfosfatidilcolina (DMPC), 1 -miristoil-2-palmitoilfosfatidilcolina (MPp C), 1 -palmitoil-2-miristoilfosfatidilcolina (PMPC), 1 -palmitoil-2-estearoilfosfatidilcolina (PSPC), 1,2-diaraquidoil-sn-glicero-3-fosfocolina (DBPC), 1-estearoil-2-palmitoil fosfatidilcolina (SPPC), 1,2-dieicosenoil-sn-glicero-3-fosfocolina (DEPC), palmitoiloleoil fosfatidilcolina (POPC), lisofosfatidilcolina, dioleoil fosfatidiletanolamina (DOPE), dilinoleoilfosfatidilcolina diestearoilfosfatidiletanolamina (DSPE), dimiristoil fosfatidiletanolamina (DMPE), dipalmitoil fosfatidiletanolamina (DPPE), palmitoiloleoil fosfatidiletanolamina (POPE), lisofosfatidiletanolamina y combinaciones de las mismas. Por ejemplo, el fosfolípido neutro puede seleccionarse del grupo que consiste en diestearoilfosfatidilcolina (DSPC) y dimiristoil fosfatidiletanolamina (DMPE).
Los lípidos auxiliares incluyen lípidos que mejoran la transfección. El mecanismo por el cual el lípido auxiliar mejora la transfección puede incluir mejorar la estabilidad de las partículas. En ciertos casos, el lípido auxiliar puede mejorar la fusogenicidad de la membrana. Los lípidos auxiliares incluyen esteroides, esteroles y alquilresorcinoles. Los ejemplos de lípidos auxiliares adecuados incluyen colesterol, 5-heptadecilresorcinol y hemisuccinato de colesterol. En un ejemplo, el lípido auxiliar puede ser colesterol o hemisuccinato de colesterol.
Los lípidos sigilosos incluyen los lípidos que alteran el tiempo que las nanopartículas pueden existir in vivo. Los lípidos sigilosos pueden ayudar en el proceso de formulación, por ejemplo, reduciendo la agregación de partículas y controlando el tamaño de las partículas. Los lípidos sigilosos pueden modular las propiedades farmacocinéticas de la LNP. Los lípidos sigilosos adecuados incluyen lípidos que tienen un grupo de cabeza hidrófilo unido a un resto lipídico.
El grupo principal hidrófilo del lípido sigiloso puede comprender, por ejemplo, un resto polimérico seleccionado entre polímeros basados en PEG (a veces denominado poli(óxido de etileno)), poli(oxazolina), poli(alcohol vinílico), poli(glicerol), poli(N-vinilpirrolidona), poliaminoácidos y poli N-(2-hidroxipropil)metacrilamida. El término PEG significa cualquier polietilenglicol u otro polímero de éter de polialquileno. En ciertas formulaciones de LNP, el PEG es un PEG-2K, también denominado PEG 2000, que tiene un peso molecular promedio de aproximadamente 2000 dáltones.Véase, p.ej.,la patente WO 2017/173054 A1.
El resto lipídico del lípido sigiloso puede derivarse, por ejemplo, del diacilglicerol o la diacilglicamida, incluidos los que comprenden un grupo dialquilglicerol o dialquilgliamida que tiene una longitud de cadena alquílica que comprende independientemente de aproximadamente C4 a aproximadamente C40 átomos de carbono saturados o insaturados, en donde la cadena puede comprender uno o más grupos funcionales tales como, por ejemplo, una amida o un éster. El grupo dialquilglicerol o dialquilglicamida puede comprender además uno o más grupos alquilo sustituidos.
Como ejemplo, el lípido sigiloso puede seleccionarse entre PEG-dilauroilglicerol, PEG-dimiristoilglicerol (PEG-DMG), PEG-dipalmitoilglicerol, PEG-diestearoilglicerol (PEG-DSPE), PEG-dilaurilglicolamida, PEG-dimiristilglicolamida, PEG-dipalmitoilglicolamida y PEG-diestearoilglicolamida, PEG-colesterol (1-[8'-(Colest-5-en-3[beta]-oxi)carboxamido-3',6'-dioxaoctanil]carbamoil-[omega]-metil-poli(etilenglicol), PEG-DMB (éter de 3,4-ditetradecoxilbencil-[omega]-metilpoli(etilenglicol)), 1,2-dimiristoil-sn-glicero-3-fosfoetanolamina-N-[metoxi(polietilenglicol)-2000] (PEG2k-DMG), 1,2-diestearoil-sn-glicero-3-fosfoetanolamina-N-[metoxi(polietilenglicol)-2000] (PEG2k-DSPE), 1,2-diestearoil-sn-glicerol, metoxipolietilenglicol (PEG2k-DSG), poli(etilenglicol)-2000-dimetacrilato (PEG2k-DMA) y 1,2-diesteariloxipropil-3-amina-N-[metoxi(polietilenglicol)-2000] (PEG2k-DSA). En un ejemplo particular, el lípido sigiloso puede ser PEG2k-DMG.
Las LNP pueden comprender diferentes proporciones molares respectivas de los lípidos componentes en la formulación. El % en moles del lípido CCD puede ser, por ejemplo, de aproximadamente el 30 % en moles a aproximadamente el 60 % en moles, de aproximadamente el 35 % en moles a aproximadamente el 55 % en moles, de aproximadamente el 40 % en moles a aproximadamente el 50 % en moles, de aproximadamente el 42 % en moles a aproximadamente el 47 % en moles, o aproximadamente el 45 %. El % en moles del lípido auxiliar puede ser, por ejemplo, de aproximadamente el 30 % en moles a aproximadamente el 60 % en moles, de aproximadamente el 35 % en moles a aproximadamente el 55%en moles, de aproximadamente el 40%en moles a aproximadamente el 50%en moles, de aproximadamente el 41 % en moles a aproximadamente el 46 % en moles, o aproximadamente el 44 % en moles. El % en moles del lípido neutro puede ser, por ejemplo, de aproximadamente el 1 % en moles a aproximadamente el 20 % en moles, de aproximadamente el 5 % en moles a aproximadamente el 15 % en moles, de aproximadamente el 7 % en moles a aproximadamente el 12 % en moles, o aproximadamente el 9 % en moles. El % en moles del lípido sigiloso puede ser, por ejemplo, de aproximadamente un 1 % en moles a aproximadamente un 10 % en moles, de aproximadamente un 1 % en moles a aproximadamente un 5 % en moles, de aproximadamente un 1 % en moles a aproximadamente un 3 % en moles, aproximadamente un 2 % en moles o aproximadamente un 1 % en moles.
Las LNP pueden tener diferentes proporciones entre los grupos amina cargados positivamente del lípido biodegradable (N) y los grupos fosfato (P) cargados negativamente del ácido nucleico que se va a encapsular. Esto puede representarse matemáticamente mediante la ecuación N/P. Por ejemplo, la relación N/P puede ser de aproximadamente 0,5 a aproximadamente 100, de aproximadamente 1 a aproximadamente 50, de aproximadamente 1 a aproximadamente 25, de aproximadamente 1 a aproximadamente 10, de aproximadamente 1 a aproximadamente 7, de aproximadamente 3 a aproximadamente 5, de aproximadamente 4 a aproximadamente 5, aproximadamente 4, aproximadamente 4,5 o aproximadamente 5.
En algunas LNP, la carga puede comprender ácido nucleico donante exógeno y ARNg. El ácido nucleico donante exógeno y los ARNg pueden estar en diferentes proporciones. Por ejemplo, la formulación de LNP puede incluir una relación de ácido nucleico donante exógeno a ácido nucleico de ARNg que varía entre aproximadamente 25:1 a aproximadamente 1:25, que varía entre aproximadamente 10:1 a aproximadamente 1:10, que varía entre aproximadamente 5:1 a aproximadamente 1:5, o aproximadamente 1:1. Alternativamente, la formulación de LNP puede incluir una relación de ácido nucleico donante exógeno a ácido nucleico de ARNg de aproximadamente 1:1 a aproximadamente 1:5, de aproximadamente 5:1 a aproximadamente 1:1, aproximadamente 10:1 o aproximadamente 1:10. Alternativamente, la formulación de LNP puede incluir una relación de ácido nucleico donante exógeno a ácido nucleico de ARNg de aproximadamente 1:10, 25:1, 10:1, 5:1, 3:1, 1: 1, 1:3, 1:5, 1:10 o 1:25.
Un ejemplo específico de una LNP adecuada tiene una relación de nitrógeno a fosfato (N/P) de 4,5 y contiene lípidos catiónicos biodegradables, colesterol, DSPC y PEG2k-DMG en una relación molar de 45:44:9:2. El lípido catiónico biodegradable puede ser (9Z,12Z)-3-((4,4-bis(octiloxi)butanoil)oxi)-2-((((3-(dietilamino)propoxi)carbonil)oxi)metil)propilo octadeca-9,12-dienoato, también llamado 3-((4,4-bis(octiloxi)butanoil)oxi)-2-((((3-(dietilamino)propoxi)carbonil)oxi)metil)propilo (9Z,12Z)-octadeca-9,12-dienoato.Véase, p. ej.,Finn y col. (2018) Cell Reports 22:1-9. Otro ejemplo específico de una LNP adecuada contiene Dlin-MC3-d Ma (MC3), colesterol, d Sp C, y p Eg -DMG en una relación molar de 50:38,5:10:1,5.
El modo de suministro se puede seleccionar para disminuir la inmunogenicidad. Por ejemplo, un ARNg y un ácido nucleico donante exógeno pueden suministrarse mediante diferentes modos (p. ej., suministro bimodal). Estos diferentes modos pueden conferir diferentes propiedades farmacodinámicas o farmacocinéticas a la molécula suministrada al sujeto (p. ej., la codificación del ARNg o el ácido nucleico, o el molde de reparación/ácido nucleico donante exógeno). Por ejemplo, los diferentes modos pueden dar como resultado una distribución tisular diferente, una media vida diferente o una distribución temporal diferente. Algunos modos de suministro (p. ej., el suministro de un vector de ácido nucleico que persiste en una célula mediante replicación autónoma o integración genómica) dan como resultado una expresión y presencia más persistentes de la molécula, mientras que otros modos de suministro son transitorios y menos persistentes (p. ej., el suministro de un ARN o una proteína). El suministro de componentes de una manera más transitoria, por ejemplo, como ARN o proteína, puede garantizar que el complejo Cas/ARNg solo esté presente y activo durante un corto período de tiempo y puede reducir la inmunogenicidad. Tal suministro transitorio también puede reducir la posibilidad de modificaciones fuera de la diana.
La administración¡n vivopuede ser por cualquier vía adecuada, que incluye, por ejemplo, la parenteral, intravenosa, oral, subcutánea, intraarterial, intracraneal, intratecal, intraperitoneal, tópica, intranasal o intramuscular. Los modos sistémicos de administración incluyen, por ejemplo, las vías oral y parenteral. Los ejemplos de vías parenterales incluyen las vías intravenosa, intraarterial, intraósea, intramuscular, intradérmica, subcutánea, intranasal e intraperitoneal. Un ejemplo específico es la infusión intravenosa. Los modos de administración locales incluyen, por ejemplo, el suministro intratecal, intracerebroventricular, intraparenquimatoso (p. ej., el suministro intraparenquimatoso localizado al cuerpo estriado (p. ej., al caudado o al putamen), la corteza cerebral, la circunvolución precentral, el hipocampo (p. ej., al giro dentado o la región CA3), la corteza temporal, la amígdala, la corteza frontal, el tálamo, el cerebelo, médula, hipotálamo, tectum, tegmento o sustancia negra), vías intraoculares, intraorbitarias, subconjuntivales, intravítreas, subretinianas y transesclerales. Cantidades significativamente más pequeñas de los componentes (en comparación con los enfoques sistémicos) pueden ejercer un efecto cuando se administran localmente (por ejemplo, intraparenquimatoso o intravítreo) en comparación con cuando se administran sistémicamente (por ejemplo, por vía intravenosa). Los modos de administración locales también pueden reducir o eliminar la incidencia de efectos secundarios potencialmente tóxicos que pueden producirse cuando se administran por vía sistémica cantidades terapéuticamente eficaces de un componente.
La administración in vivo puede ser por cualquier vía adecuada, que incluye, por ejemplo, la parenteral, intravenosa, oral, subcutánea, intraarterial, intracraneal, intratecal, intraperitoneal, tópica, intranasal o intramuscular. Un ejemplo específico es la infusión intravenosa. La instilación nasal y la inyección intravítrea son otros ejemplos específicos.
Las composiciones que comprenden los ARN guía (o ácidos nucleicos que codifican los ARN guía) pueden formularse utilizando uno o más portadores, diluyentes, excipientes o auxiliares fisiológica y farmacéuticamente aceptables. La formulación puede depender de la vía de suministro elegida. El término “ farmacéuticamente aceptable” significa que el portador, diluyente, excipiente o auxiliar es compatible con los demás ingredientes de la formulación y no es sustancialmente perjudicial para el receptor de la misma.
La frecuencia de administración y el número de dosificaciones pueden depender de la semivida de los ácidos nucleicos o ARN guía donantes exógenos (o ácidos nucleicos que codifican los ARN guía) y de la vía de suministro, entre otros factores. La introducción de ácidos nucleicos o proteínas en la célula o el animal no humano se puede realizar una vez o varias veces durante un período de tiempo. Por ejemplo, la introducción puede realizarse al menos dos veces durante un período de tiempo, al menos tres veces durante un período de tiempo, al menos cuatro veces durante un período de tiempo, al menos cinco veces durante un período de tiempo, al menos seis veces durante un período de tiempo, al menos siete veces durante un período de tiempo, al menos ocho veces durante un período de tiempo, al menos nueve veces durante un período de tiempo, al menos diez veces durante un período de tiempo, al menos once veces durante un período de tiempo, al menos doce veces durante un período de tiempo, al menos trece veces durante un período de tiempo, al menos catorce veces durante un período de tiempo, al menos quince veces durante un período de tiempo, al menos dieciséis veces durante un período de tiempo, al menos diecisiete veces durante un período de tiempo, al menos dieciocho veces durante un período de tiempo, al menos diecinueve veces durante un período de tiempo, o al menos veinte veces durante un período de tiempo.
D. Medición de la actividad de CRISPR/Casin vivoy evaluación de la modificación de un locus genómico diana
Los métodos descritos en la presente memoria comprenden evaluar la modificación del locus genómico diana. Los métodos para detectar o medir la expresión o la actividad dependerán del locus genómico diana que se modifique.
Por ejemplo, si el locus genómico diana comprende un gen que codifica un ARN o una proteína, y la modificación prevista es cambiar la expresión del ARN o la proteína codificados, el método para evaluar la modificación del locus genómico diana puede comprender medir la expresión o la actividad del ARN o la proteína codificados. Por ejemplo, si la proteína codificada es una proteína liberada en el suero, se pueden medir los niveles séricos de la proteína codificada. Los ensayos para medir los niveles y la actividad del ARN y las proteínas son bien conocidos.
Alternativamente, los métodos descritos en la presente memoria pueden comprender además identificar una célula que tiene un locus genómico diana modificado en donde la secuencia se ha modificado mediante una unión de extremos no homólogos (p. ej., presencia de pequeñas inserciones o deleciones (indeles)) tras la escisión mediante CRISPR/Cas, en la que se ha escindido una secuencia en el locus genómico diana entre dos secuencias diana de ARN guía, o en la que el locus genómico diana se ha modificado mediante recombinación la unión con un ácido nucleico donante exógeno. Pueden utilizarse diversos métodos para identificar células y animales que tengan una modificación genética dirigida. La evaluación puede comprender un ensayo cuantitativo para evaluar la modificación de alelo (MOA) de un cromosoma parental. Por ejemplo, el ensayo cuantitativo puede llevarse a cabo a través de una PCR cuantitativa, tal como una PCR en tiempo real (qPCR). La p Cr en tiempo real puede utilizar un primer conjunto de iniciadores que reconoce el locus diana y un segundo conjunto de iniciadores que reconoce un locus de referencia no diana. El conjunto de iniciadores puede comprender una sonda fluorescente que reconoce la secuencia amplificada. Otros ejemplos de ensayos cuantitativos adecuados incluyen hibridación in situ mediada por fluorescencia (FISH), hibridación genómica comparativa, amplificación de ADN isotérmico, hibridación cuantitativa con una o más sondas inmovilizadas, sondas INVADER®, sondas TAQMAN® Molecular Beacon o tecnología de sonda ECLIPSE™(véase, p. ej.,US 2005/0144655).
La secuenciación de próxima generación (NGS) también se puede utilizar para la detección. La secuenciación de próxima generación también se puede denominar “ NGS” o “ secuenciación masivamente paralela” o “ secuenciación de alto rendimiento” . La NGS puede utilizarse como una herramienta de detección además de los ensayos de MOA para definir la naturaleza exacta de la modificación genética dirigida y si es consistente en todos los tipos de células o tipos de tejidos o tipos de órganos.
La evaluación de la modificación del locus genómico diana en un animal no humano puede realizarse en cualquier tipo de célula de cualquier tejido u órgano. Por ejemplo, la modificación del locus genómico diana puede evaluarse en múltiples tipos de células del mismo tejido u órgano o en células de múltiples ubicaciones dentro del tejido u órgano. Esto puede proporcionar información sobre qué tipos de células dentro de un tejido u órgano diana se están modificando o qué secciones de un tejido u órgano están siendo alcanzadas por el CRISPR/Cas y modificadas. Como otro ejemplo, la modificación del locus genómico diana puede evaluarse en múltiples tipos de tejido o en múltiples órganos. En los métodos en los que se ataca un tejido u órgano en particular, esto puede proporcionar información sobre la eficacia con la que se direcciona a ese tejido u órgano y si hay efectos fuera del diana en otros tejidos u órganos.
En algunos ejemplos específicos, se pueden utilizar animales no humanos preparados para Cas9 para evaluar las tasas de edición de varios ARN guía. Los ARN guía pueden introducirse como ARN guía único (modificado y no modificado) o ARN dúplex, o expresarse bajo un promotor U6 (p. ej., mediante AAV). Los animales no humanos preparados para Cas9 también pueden cruzarse con animales no humanos que comprenden alelos humanizados (animales no humanos) que expresan ARN guía para su evaluación en el modelado de enfermedades.
IV. Métodos para fabricar animales no humanos que comprenden un casete de expresión de Cas y/o un casete de expresión de recombinasa
En la presente memoria se describen diversos métodos para fabricar un animal no humano que es un ratón o una rata que comprende uno o más o todos los casetes de expresión de Cas y de expresión de recombinasa, como se describe en cualquier otro sitio de la presente memoria. Cualquier método o protocolo conveniente para producir un organismo genéticamente modificado es adecuado para producir dicho animal no humano genéticamente modificado.Véase, p. ej.,Cho y col. (2009) Current Protocols in Cell Biology 42:19.11:19.11.1-19.11.22 y Gama Sosa y col. (2010) Brain Struct. Funct. 214(2-3):91-109. Tales animales no humanos modificados genéticamente pueden generarse, por ejemplo, mediante la incorporación de genes en un locus diana (p. ej., un locus de puerto seguro tal comoRosa26)o mediante el uso de un transgén de integración aleatoria.Véase, p. ej.,las patentes WO 2014/093622 y WO 2013/176772. Los métodos para dirigir un constructo al locusRosa26se describen, por ejemplo, en las patentes US-2012/0017290, US-2011/0265198 y US-2013/0236946.
Por ejemplo, el método para producir un animal no humano que comprende uno o más o todos los casetes de expresión de Cas y un casete de expresión de recombinasa, como se describe en cualquier otro sitio de la presente memoria, puede comprender: (1) modificar el genoma de una célula pluripotente para que comprenda uno o más o todos de un casete de expresión de Cas y un casete de expresión de recombinasa; (2) identificar o seleccionar la célula pluripotente modificada genéticamente que comprende uno o más o todos los casetes de expresión de Cas y un casete de expresión de recombinasa; (3) introducir la célula pluripotente modificada genéticamente en un embrión huésped animal no humano; e (4) implantar y gestar el embrión huésped en una madre sustituta. Opcionalmente, el embrión huésped que comprende una célula pluripotente modificada (por ejemplo, una célula ES no humana) puede incubarse hasta la etapa de blastocisto antes de implantarse y gestarse en la madre sustituta para producir un animal no humano F0. La madre sustituta puede entonces producir un animal no humano de la generación F0 que comprende uno o más o todos un casete de expresión de Cas y un casete de expresión de recombinasa.
Los métodos pueden comprender además identificar una célula o un animal que tenga un locus genómico diana modificado. Pueden usarse diversos métodos para identificar células y animales que tengan una modificación genética objetivo.
La etapa de evaluación puede comprender, por ejemplo, un ensayo cuantitativo para evaluar la modificación de alelo (MOA) de un cromosoma parental. Por ejemplo, el ensayo cuantitativo puede llevarse a cabo a través de una PCR cuantitativa, tal como una PCR en tiempo real (qPCR). La PCR en tiempo real puede utilizar un primer conjunto de iniciadores que reconoce el locus diana y un segundo conjunto de iniciadores que reconoce un locus de referencia no diana. El conjunto de iniciadores puede comprender una sonda fluorescente que reconoce la secuencia amplificada.
Otros ejemplos de ensayos cuantitativos adecuados incluyen hibridación in situ mediada por fluorescencia (FISH), hibridación genómica comparativa, amplificación de ADN isotérmico, hibridación cuantitativa con una o más sondas inmovilizadas, sondas INVADER®, sondas TAQMAN® Molecular Beacon o tecnología de sonda ECLIPSE™(véase, p. ej.,US 2005/0144655).
Un ejemplo de una célula pluripotente adecuada es una célula madre embrionaria (ES) que es una célula ES de ratón o una célula ES de rata. La célula pluripotente modificada puede generarse, por ejemplo, (a) introduciendo en la célula uno o más vectores de direccionamiento que comprenden un inserto de ácido nucleico flanqueado por brazos de homología 5' y 3' correspondientes a sitios diana 5' y 3', en donde el ácido nucleico insertado comprende uno o más o todos los casetes de expresión de Cas y un casete de expresión de recombinasa; e (b) identificar al menos una célula que comprende en su genoma el inserto de ácido nucleico integrado en el locus genómico diana. Alternativamente, la célula pluripotente modificada puede generarse (a) introduciendo en la célula: (i) un agente nucleasa, en donde el agente nucleasa induce un corte o una ruptura de cadena doble en una secuencia diana dentro del locus genómico diana; y (ii) uno o más vectores de direccionamiento que comprenden un inserto de ácido nucleico flanqueado por brazos de homología 5' y 3' correspondientes a sitios diana 5' y 3' localizados lo suficientemente cerca de la secuencia diana, en donde el ácido nucleico de inserción comprende uno o más o todos de un casete de expresión de Cas y un casete de expresión de recombinasa; e (c) identificar al menos una célula que comprende una modificación (p. ej., la integración del ácido nucleico insertado) en el locus genómico diana. Puede utilizarse cualquier agente de nucleasa que induzca una mella o ruptura de doble cadena en una secuencia diana deseada. Los ejemplos de nucleasas adecuadas incluyen una nucleasa efectora similar a un activador de la transcripción (TALEN), una nucleasa con dedos de zinc (ZFN), una meganucleasa y sistemas de repeticiones palindrómicas cortas agrupadas regularmente intercaladas (CRISPR)/asociadas a CRISPR (Cas) o componentes de tales sistemas (p. ej., CRISPR/Cas9).Véase, p. ej.,las patentes US-2013/0309670 y US-2015/0159175.
La célula donante puede introducirse en un embrión huésped en cualquier etapa, tal como la etapa de blastocisto o la etapa de premórula (es decir, la etapa de 4 células o la etapa de 8 células). Se genera progenie que es capaz de transmitir la modificación genética a través de la línea germinal.Véase, p. ej.,la patente US-7.294.754.
Alternativamente, el método de producción de los animales no humanos descrito en cualquier otro sitio de la presente memoria puede comprender: (1) modificar el genoma de un embrión en estadio unicelular para que comprenda uno o más o todos los casetes de expresión de Cas y un casete de expresión de recombinasa utilizando los métodos descritos anteriormente para modificar las células pluripotentes; (2) seleccionar el embrión modificado genéticamente; e (3) implantar y gestar el embrión modificado genéticamente en una madre sustituta. Se genera progenie que es capaz de transmitir la modificación genética a través de la línea germinal.
También se describen técnicas de transferencia nuclear que también pueden usarse para generar animales mamíferos no humanos. En resumen, los métodos de transferencia nuclear pueden incluir las siguientes etapas: (1) enuclear un ovocito o proporcionar un ovocito enucleado; (2) aislar o proporcionar una célula o núcleo donante para combinarlo con el ovocito enucleado; (3) insertar la célula o el núcleo en el ovocito enucleado para formar una célula reconstituida; (4) implantar la célula reconstituida en el útero de un animal para formar un embrión; y (5) permitir el desarrollo del embrión. En tales métodos, los ovocitos se recuperan generalmente de animales muertos, aunque también pueden aislarse de oviductos y/u ovarios de animales vivos. Los ovocitos pueden madurarse en una variedad de medios bien conocidos antes de la enucleación. La enucleación del ovocito puede realizarse de varias maneras bien conocidas. La inserción de la célula o el núcleo donante en el ovocito enucleado para formar una célula reconstituida puede realizarse mediante microinyección de una célula donante debajo de la zona pelúcida antes de la fusión. La fusión puede inducirse mediante la aplicación de un pulso eléctrico de CD a través del plano de contacto/fusión (electrofusión), mediante la exposición de las células a sustancias químicas que promueven la fusión, tal como el polietilenglicol, o mediante un virus inactivado, tal como el virus Sendai. Una célula reconstituida puede activarse por medios eléctricos y/o no eléctricos antes, durante y/o después de la fusión del núcleo donante y el ovocito receptor. Los métodos de activación incluyen pulsos eléctricos, choques inducidos químicamente, penetración de espermatozoides, niveles crecientes de cationes divalentes en el ovocito y reducción de la fosforilación de proteínas celulares (por medio de inhibidores de quinasa) en el ovocito. Las células reconstituidas activadas, o embriones, pueden cultivarse en medios bien conocidos y después transferirse al útero de un animal.Véase, p. ej.,las patentes US-2008/0092249, WO 1999/005266, US-2004/0177390, WO 2008/017234 y la patente US-7.612.250.
Los diversos métodos descritos en la presente memoria permiten la generación de un animal F0 no humano modificado genéticamente, en donde las células del animal F0 modificado genéticamente comprenden uno o más o todos de un casete de expresión de Cas y un casete de expresión de recombinasa. Se reconoce que, dependiendo del método utilizado para generar el animal F0, el número de células dentro del animal F0 que tienen uno o más o todos los casetes de expresión de Cas y un casete de expresión de recombinasa variará. La introducción de las células ES donantes en un embrión en estadio de premórula de un organismo correspondiente (p. ej., un embrión de ratón en estadio de 8 células) a través de, p. ej., el método VELOCIMOUSE®, permite que un mayor porcentaje de la población celular del animal F0 comprenda células que tengan la secuencia de nucleótidos de interés que comprende la modificación genética dirigida. Por ejemplo, al menos 50 %, 60 %, 65 %, 70 %, 75 %, 85 %, 86 %, 87 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la contribución celular del animal F0 no humano puede comprender una población celular que tenga la modificación objetivo.
Las células del animal F0 modificado genéticamente pueden ser heterocigotas para uno o más o todos un casete de expresión de Cas y un casete de expresión de recombinasa o pueden ser homocigotas para uno o más o todos los casetes de expresión de Cas y un casete de expresión de recombinasa.
Si se asocian diferentes versiones de una secuencia con un número de registro en diferentes momentos, se entiende la versión asociada con el número de registro en la fecha de presentación efectiva de la presente solicitud. La fecha de presentación efectiva significa que la fecha de presentación o la fecha de presentación actual de una aplicación prioritaria se refiere al número de registro si corresponde. Igualmente, si se publican diferentes versiones de una publicación, sitio web o similares en diferentes momentos, se entiende la versión más recientemente publicada en la fecha de presentación efectiva de la solicitud, a menos que se indique de cualquier otra manera. Cualquier característica, etapa, elemento, realización o aspecto de la invención se puede usar junto con cualquier otro a menos que se indique específicamente lo contrario. Aunque la presente invención se ha descrito con cierto detalle a modo de ilustración y de ejemplo con fines de claridad y comprensión, será evidente que pueden ponerse en práctica ciertos cambios y modificaciones dentro del alcance de las reivindicaciones adjuntas.
Breve descripción de las secuencias
Las secuencias de nucleótidos y aminoácidos enumeradas en el listado de secuencias adjunto se muestran mediante el uso de abreviaturas de letras estándar para las bases de nucleótidos y un código de tres letras para los aminoácidos. Las secuencias de nucleótidos siguen la convención estándar de comenzar en el extremo 5' de la secuencia y avanzar (es decir, de izquierda a derecha en cada línea) hasta el extremo 3'. Solo se muestra una cadena de cada secuencia de nucleótidos, pero se entiende que la cadena complementaria está incluida por cualquier referencia a la cadena mostrada. Cuando se proporciona una secuencia de nucleótidos que codifica una secuencia de aminoácidos, se entiende que también se proporcionan variantes de codones degenerados de la misma que codifican la misma secuencia de aminoácidos. Las secuencias de aminoácidos siguen la convención estándar de comenzar en el extremo amino de la secuencia y avanzar (es decir, de izquierda a derecha en cada línea) hasta el extremo carboxi.
Tabla 3. Descripción de secuencias.
Ejemplos
Ejemplo 1. Validación de ratones preparados para Cas9
La CRISPR/Cas9, una endonucleasa de ADN guiada por ARN, cataliza la creación de una ruptura de cadena doble (DSB) del ADN en el sitio de unión de su guía de ARN. Un ARN guía ilustrativo puede consistir en un ARN CRISPR de 42 nucleótidos (ARNcr) que se une a un ARN transactivador de 87 nucleótidos (ARNtracr). El ARNtracr es complementario y se empareja de bases con el ARNcr, formando un ARNcr/ARNtracr guía funcional. Este ARN dúplex se une a la proteína Cas9 para formar una ribonucleoproteína activa (RNP) que puede interrogar el genoma para determinar su complementariedad con la parte guía de 20 nucleótidos del ARNcr. Un requisito secundario para la ruptura de la cadena es que la proteína Cas9 debe reconocer un motivo adyacente al protoespaciador (PAM) directamente adyacente a la secuencia complementaria a la parte guía del ARNcr (la secuencia diana del ARNcr). Alternativamente, también se puede formar un complejo de RNP activo reemplazando el dúplex ARNcr/ARNtracr por un único ARN guía (ARNgu) formado uniendo covalentemente el ARNcr y el ARNtracr. Tal ARNgu se puede formar, por ejemplo, fusionando la parte guía de 20 nucleótidos del ARNcr directamente con la secuencia de ARNtracr procesada. El ARNgu puede interactuar tanto con la proteína Cas9 como con el ADN de la misma manera y con una eficacia similar a la que lo haría el dúplex ARNcr/ARNtracr. Se ha demostrado que el mecanismo de defensa natural bacteriano CRISPR funciona eficazmente en las células de los mamíferos y activa las vías de reparación endógenas inducidas por la ruptura. Cuando se produce una ruptura de cadena doble en el genoma, las vías de reparación intentarán fijar el ADN mediante las vías canónicas o alternativas de unión de extremos no homólogos (NHEJ) o mediante recombinación homóloga, también denominada reparación dirigida por homología (HDR), si se dispone de una plantilla adecuada. Podemos aprovechar estas vías para facilitar la deleción específica del sitio de las regiones genómicas o la inserción de ADN exógeno o HDR en células de mamífero.
El sistema CRISPR/Cas9 es una herramienta poderosa para la ingeniería del genoma. Sin embargo, una limitación del sistema para utilizarse¡n vivoes la necesidad de introducir simultáneamente todos los componentes en un organismo vivo. El método típico para introducir estos componentes en las células es transfectar transitoriamente constructos de ADN en células que generarán los ARN y las proteínas apropiados. Aunque es eficaz, este enfoque tiene una desventaja inherente, ya que las células deben confiar en los constructos de a Dn plasmídico para primero someterse a la transcripción y después a la traducción antes de que la proteína Cas9 esté disponible para interactuar con el componente de ARNgu. Creemos que la frecuencia de mutación y la frecuencia de recombinación inducidas por Cas9 pueden mejorarse enormemente si la proteína está disponible de forma constitutiva.
La secuencia codificante de Cas9 (CDS) silvestre se optimizó con codones para la expresión en ratones. A continuación, se incorporaron una señal de localización nuclear monopartita (NLS) N-terminal, una NLS bipartita C-terminal y un indicador fluorescente GFP unido a P2A C-terminal. El casete de expresión de Cas9 (MAID2599) se ilustra en las figuras 1 y 14 y en la id. de sec. n.°: 1. El P2A-GFP se puede utilizar para un mejor seguimiento de la expresión de Cas9in vivo.Estos componentes se diseñaron en el primer intrón del locusRosa26del genoma del ratón junto con un casete de resistencia a la neomicina floxeado anterior (casete neo) con las señales de empalme adecuadas y una fuerte señal de poliadenilación (poliA). Los componentes del casete de expresión de Cas9 de 5' a 3' se muestran en la tabla 4, y los componentes del alelo Cas9 después de la eliminación del casete de neomicina floxeado se muestran en la tabla 5. La secuencia de la proteína Cas9-P2A-EGFP codificada por el alelo se expone en la i. de sec. n.°: 13.
Tabla 4. Componentes del alelo MAID2599 de Cas9.
Tabla 5. Componentes del alelo MAID2600 de Cas9.
Antes de la deleción del casete por la acción de la recombinasa Cre, el gen de resistencia a la neomicina normalmente se transcribirá y traducirá de manera eficiente; sin embargo, el CDS Cas9 normalmente no se expresará debido a la presencia de una fuerte región poli(A), que puede bloquear eficazmente la transcripción completa. T ras la eliminación del casete neo por la acción de la recombinasa Cre, el ARNm híbrido para las proteínas Cas9 y GFP normalmente se expresará constitutivamente por el promotorRosa26.Las células dirigidas antes y después de la eliminación del casete neo se verificaron primero mediante el cribado de pérdida de alelos para detectar la integración única y específica del sitio del vector de direccionamiento en el locusRosa26.La expresión de Cas9 y GFP se validó extrayendo el ARN total de las mESC dirigidas, seguida de la transcripción inversa para generar ADNc y la qPCR TAQMAN® para detectar el ADNc transcrito de forma inversa (RT-qPCR). En conjunto, el sistema que se creó es capaz de expresar niveles consistentes de proteína Cas9 de forma continua o condicional (al requerir la eliminación de un casete de resistencia a la neomicina) en mESC y ratones derivados de ellas.
Se diseñó otra versión sin el P2A-eGFP (MAID2660). Véase la figura 14. Los componentes del casete de expresión de Cas9 de 5' a 3' se muestran en la tabla 6, y los componentes del alelo Cas9 después de la eliminación del casete de neomicina floxeado se muestran en la tabla7.La secuencia de la proteína Cas9 codificada por el alelo se expone en la id. de sec. n.°: 19.
Tabla 6. Componentes del alelo MAID2660 de Cas9.
Tabla 7. Componentes del alelo MAID2661 de Cas9.
Además, se diseñaron dos versiones con promotores CAGG exógenos y secuencias de etiquetas 3xFLAG. La primera versión incluía el P2A-eGFP (MAID2658), y la segunda versión se diseñó sin el P2A-eGFP (MAID2672). Véase la figura 14. Los componentes de la primera versión del casete de expresión de CAGG-Cas9 de 5' a 3' se muestran en la tabla 8 , y los componentes de la primera versión del alelo CAGG-Cas9 después de la eliminación del casete de neomicina floxeado se muestran en la tabla 9. La secuencia de la proteína 3xFLAG-Cas9-P2A-EGFP codificada por este alelo se expone en la id. de sec. n.°: 16. Los componentes de la segunda versión del casete de expresión de CAGG-Cas9 de 5' a 3' se muestran en la tabla 10, y los componentes de la segunda versión del alelo CAGG-Cas9 después de la eliminación del casete de neomicina floxeado se muestran en la tabla 11. La secuencia de la proteína 3xFLAG-Cas9 codificada por este alelo se expone en la id. de sec. n.°: 22.
Tabla 8. Componentes del alelo MAID2658 de Cas9.
Tabla 9. Componentes del alelo MAID2659 de Cas9.
Tabla 10. Componentes del alelo MAID2672 de Cas9.
Tabla 11. Componentes del alelo MAID2673 de Cas9.
Para validar el sistema MAID2599/MAID2600, se transfectaron las mESC de Cas9 con y sin el casete de neomicina (MAID2599 y MAID2600, respectivamente) con dos ARNgu dirigidos a las regiones de codones de inicio y parada de un primer gen diana.Véasela figura 2A. A continuación, la eficiencia de la escisión de Cas9 se analizó mediante el cribado de pérdida de alelos para evaluar la proporción de clones de mESC que tienen mutaciones de inserción-deleción en los sitios de escisión de Cas9 dirigidos a ARNg. También se determinó la proporción de clones de mESC en los que el ADN entre los sitios de escisión de Cas9 se eliminó en o en ambos alelos diana, lo que provocó una mutación nula. Cas9 pudo inducir estos cambios genómicos solo cuando se eliminaron el casete de neomicina y la poli(A) (secuencia de parada) (MAID2600). Para evaluar mejor las capacidades de edición del genoma con respecto a la reparación dirigida por homología, se introdujo un ARNgu dirigido a un segundo gen diana junto con un oligodesoxinucleótido monocatenario (ssODN) como donante de mutación puntual. Véase la figura 2B. El sistema de expresión constitutivo de Cas9 descrito en la presente memoria se comparó con los métodos tradicionales de introducción de Cas9 y ARNgu mediante plásmidos junto con un ssODN. El sistema de expresión de Cas9 descrito en la presente memoria, cuando se combinó con un plásmido que expresaba el ARNgu, pudo activar las vías de reparación endógena inducidas por la ruptura para incorporar nuestra mutación puntual deseada a una frecuencia igual a la de cuando tanto Cas9 como el ARNgu se expresaron a partir de plásmidos exógenos. Sin embargo, cuando el sistema de expresión de Cas9 descrito en la presente memoria se combinó con el ARNgu suministrado directamente, indujo una mutagénesis insercional dirigida por homología con casi el doble de la eficacia de los métodos de suministro de plásmidos.
Para determinar la eficacia de Cas9 expresada de forma endógena en ratones vivos, estas mESC dirigidas se microinyectaron en embriones de ratón de 8 células utilizando el método VELOCIMOUSE®.Véase, p. ej.,la patente US 7.576.259; US-7.659.442; US 7.294.754; US 2008/007800; y Poueymirou y col. (2007) Nature Biotech. 25(1):91-99. Específicamente, se creó un pequeño orificio en la zona pelúcida para facilitar la inyección de las mESC dirigidas. Estos embriones de 8 células inyectados se transfirieron a madres sustitutas para producir crías vivas portadoras del transgén. Tras la gestación en una madre sustituta, los embriones inyectados produjeron ratones F0 que no llevan una contribución detectable del embrión huésped. Los ratones derivados completamente de células ES eran normales, sanos y fértiles (con transmisión por línea germinal). Se recolectó tejido de ratones F0 con casete eliminado (MAID2600) para la visualización de GFP, la expresión del ARNm de Cas9 y la expresión de la proteína Cas9. Véase las figuras 3A-3F (campo claro y visualización de GFP) y las figuras 4A-4C (expresión del ARNm de Cas9 en las figuras 4A y 4C, y la expresión de proteínas en la figura 4B). La figura 3D muestra la expresión de eGFP en ratones Rosa26 Cas9 heterocigotos (MAID2600) pero una falta de expresión de eGFP correspondiente en ratones silvestres en el hígado, la figura 3E muestra la expresión de eGFP en ratones Rosa26 Cas9 heterocigotos pero una falta de expresión de eGFP correspondiente en ratones silvestres en el riñón, y la figura 3F muestra la expresión de eGFP en ratones Rosa26 Cas9 heterocigotos pero una falta de expresión de eGFP correspondiente en ratones silvestres en el cerebro. Del mismo modo, la expresión del ARNm de Cas9, analizada mediante RT-qPCR, se observó en ratones Rosa26 Cas9 heterocigotos en el cerebro, el corazón, los riñones, el hígado, los pulmones, el cuádriceps, el bazo y el timo, pero no se observó expresión del ARNm de Cas9 en los tejidos correspondientes de ratones silvestres. Véase las figuras 4A y 4C. En los experimentos, se ensayaron cantidades de masa iguales de ARN de cada tejido mediante RT-qPCR. Los datos muestran que los ratones preparados para Cas9 expresan el ARNm de Cas9 a un nivel fácilmente detectable en todos los tejidos. Se recolectaron diversos tejidos de ratones preparados para Cas9. Se recolectaron tres tejidos de catorce ratones y se recogieron cinco tejidos adicionales de cuatro ratones para evaluar las diferencias de un ratón a otro, así como de un tejido a otro dentro de un ratón. A cada uno de estos tejidos se le extrajo el ARN.
El ADN genómico se degradó para que no contara para la reacción de qPCR. El ARN se transcribió de forma inversa y después se utilizó un ensayo específico para Cas9 para detectar los transcritos de Cas9. Como se esperaba, el ratón Cas9 mostró una expresión significativa (valores de ct inferiores a 30), mientras que los ratones WT mostraron valores de ct de 30 y superiores, lo que indica que no hay expresión endógena de la proteína Cas9.
Similarmente, la expresión de la proteína Cas9 determinada mediante membrana de Western utilizando el anticuerpo Cas9 de ThermoFisher MA5-23519 a una dilución de 1:250 y utilizando actina como control, mostró la expresión de la proteína Cas9 en ratones Rosa26 Cas9 heterocigotos (MAID2600) en el bazo, el hígado y el cerebro, mientras que la proteína Cas9 no se observó en los mismos tejidos en ratones silvestres. Véase la figura 4B. Las tres pruebas indicaron un nivel constante de expresión en todos los tejidos analizados.
A continuación, se llevó a cabo un experimento para eliminar el gen diana 3, que codifica una proteína secretada por el hígado y que se encuentra en el suero, mediante la introducción de un ARNgu en los hepatocitos primarios aislados de ratones Cas9 con casetes eliminados (MAID2600) mediante el suministro de nanopartículas lipídicas (LNP). Véase la figura 5B. Como control, los mismos métodos de introducción de ARNgu se combinaron con la expresión exógena de Cas9 en hepatocitos primarios aislados de ratones silvestres (WT). Véase la figura 5A. A continuación, se evaluó la unión de extremos no homólogos mediante la secuenciación de próxima generación (NGS) para medir las frecuencias de indel en el locus del gen diana 3. En el experimento, había tres condiciones: (1) Suministro mediado por LNP de ARNm de GFP y un ARNgu de control (es decir, muerto); (2) Suministro mediado por LNP de ARNm de GFP y un ARNgu del gen diana 3; y (3) Suministro mediado por LNP de un ARNm de Cas9 y un gen diana 3 ARNgu). Para cada condición, se probaron cuatro concentraciones de ARNm: 15,6 ng/ml, 62,5 ng/ml, 250 ng/ml y 1000 ng/ml. En los hepatocitos primarios de ratón silvestre, solo se observó un aumento dependiente de la dosis en la frecuencia de inserción/deleción cuando se introdujeron tanto el ARNm de Cas9 como el ARNgu del gen diana 3. Por el contrario, en los hepatocitos primarios de ratón preparados para Cas9, se observó un efecto dependiente de la dosis similar cuando se introdujo el ARN guía del gen 3 diana con el ARNm de la GFP de control en lugar del ARNm de Cas9, y el nivel de frecuencia de inserción/deleción fue esencialmente idéntico a los niveles observados cuando también se introdujo el ARNm de Cas9.
A continuación, se llevó a cabo un experimento para eliminar el gen diana 3in vivomediante la introducción de un ARNgu en ratones Cas9 con casetes eliminados (MAID2600) mediante el suministro hidrodinámico de ADN (HDD), el suministro de nanopartículas lipídicas (LNP), o la introducción de un virus adenoasociado (AAV) que portaba una secuencia de expresión de ARNgu mediante inyección en la vena de la cola. Véase las figuras 6A-6D. Como control, los mismos métodos de introducción de ARNgu se combinaron con la expresión exógena de Cas9 en ratones silvestres (WT). Para el suministro mediado por LNP, se probaron tres grupos de ratones: (1) Ratones preparados para Cas9 (3 machos 3 hembras; 2 mg/kg de ARNgu de control ARNm de GFP); (2) Ratones preparados para Cas9 (3 machos 3 hembras; 2 mg/kg de ARNgu de control 3 ARNm de GFP); y (3) Ratones WT (3 machos 3 hembras; 2 mg/kg de ARNgu para el gen diana 3 ARNm de Cas9). Para el suministro mediado por AAV, se probaron dos grupos de ratones: (1) Ratones preparados para Cas9 (3 machos 3 hembras; AAV8-ARNgu para el gen diana 3); y (2) Ratones WT (3 machos 3 hembras; AAV8-ARNgu para el gen diana 3 AAV8-Cas9). Para HDD, se probaron dos grupos de ratones: (1) Ratones preparados para Cas9 (3 machos 3 hembras; ARNgu para el gen diana 3); y (2) Ratones WT (3 machos 3 hembras; ARNgu para el gen diana 3 Cas9). Los ratones preparados para Cas9 tenían una inactivación génica constante y significativamente más dirigida que los ratones WT con expresión exógena de Cas9.
Sorprendentemente, el suministro mediado por AAV8 del ARNgu del gen diana 3 a ratones preparados para Cas9 (MAID2600) fue más eficaz que el suministro mediado por LNP o el HDD para dirigirse al gen diana hepático 3. Véase las figuras 6A-6D. Además, el suministro mediado por el AAV8 del ARNgu del gen diana 3 a ratones preparados para Cas9 fue más eficaz que el suministro mediado por el AAV8 del ARNgu y Cas9 del gen diana 3 a ratones WT, mientras que no se observó mucha diferencia entre ambas condiciones utilizando el suministro mediado por LNP o HDD. Véase las figuras 6A-6D. Estos resultados indican que el suministro mediado por AAV de ARN guía a ratones listos para Cas9 puede ser un medio particularmente eficaz para evaluar la actividad de ARNg in vivo. Los niveles séricos de la proteína codificada por el gen diana 3 (es decir, la proteína diana 3) se midieron en ratones hembra y macho los días 7 y 21 después de la introducción de los componentes CRISPR/Cas. Los ratones probados incluyeron ratones preparados para Cas9 y ratones silvestres. Los controles incluyeron ratones preparados para Cas9 y ratones WT en los que no se introdujeron ni Cas9 ni el ARNgu del gen diana 3. El suministro hidrodinámico del ARN guía o la combinación de Cas9 y el ARN guía no redujeron los niveles séricos de la proteína 3 diana de manera significativa en comparación con los ratones WT de control en los que no se introdujeron ni Cas9 ni el ARN guía. Para el suministro mediado por LNP, la introducción del ARNgu en ratones preparados para Cas9 dio como resultado niveles séricos similares de proteína diana en comparación con los ratones WT, en los que se introdujeron tanto la Cas9 como el ARNgu, y cada una de estas condiciones dio como resultado niveles séricos reducidos de la proteína diana 3 en aproximadamente un 50 % en comparación con los ratones de control preparados para Cas9 en los que no se introdujeron ni Cas9 ni el ARN guía. Sin embargo, para el suministro mediado por AAV8, el suministro del ARNgu a ratones preparados para Cas9 dio como resultado una disminución de varias veces en los niveles séricos de la proteína diana 3 en comparación con los ratones WT en los que se introdujeron tanto Cas9 como el ARNgu, y una disminución aún más dramática en comparación con los ratones WT de control en los que no se introdujeron ni Cas9 ni el ARN guía. Para el día 21, los niveles séricos de la proteína diana 3 habían disminuido hasta cerca del límite de detección en ratones preparados para Cas9 en los que se introdujo el ARNgu a través del AAV8.
La figura 7 muestra el porcentaje de actividad del NHEJ (frecuencia de indel) en el locus del gen 3 diana en el hígado en ratones silvestres y ratones Cas9 con casete eliminado (MAID2600) un mes después del suministro de nanopartículas lipídicas (LNP) de ARNgu solo o junto con el ARNm Cas9, el suministro hidrodinámico (HDD) del plásmido ARNgu solo o junto con el plásmido Cas9, o el AAV8-ARNgu solo o junto con AAV8-Cas9. El porcentaje de células hepáticas con inserciones/deleciones (indeles) en el locus se midió mediante NGS. El suministro hidrodinámico del ARN guía o la combinación de Cas9 y el ARN guía dieron como resultado un bajo porcentaje de indeles. Para el suministro mediado por LNP, la introducción del ARNgu en ratones preparados para Cas9 dio como resultado un porcentaje similar de indeles en comparación con los ratones naturales en los que se introdujeron tanto Cas9 como el ARNgu, y cada una de estas condiciones dio como resultado un nivel porcentual de indeles de aproximadamente el 40 %. Sin embargo, en el caso del suministro mediado por el AAV8, el suministro del ARNgu a ratones preparados para Cas9 dio como resultado un porcentaje mucho mayor de indeles (~75 %) en comparación con los ratones naturales en los que se introdujeron tanto Cas9 como el ARNgu (~35 %), y un aumento aún más drástico en comparación con los ratones naturales de control, en los que no se introdujeron ni Cas9 ni el ARN guía.
También se realiza una secuenciación adicional de próxima generación (NGS) en los tejidos recolectados. La secuenciación de amplicones se utiliza después para evaluar la cantidad de edición en los tejidos recolectados. Los cebadores específicos para dianas están diseñados para producir un producto de aproximadamente 300 pares de bases que está ligeramente descentrado alrededor del sitio de corte esperado de la guía. Después, a los cebadores se les añaden secuencias “ adaptadoras” que permitirán codificar las muestras individuales en una reacción de PCR secundaria. Una vez que se añaden los códigos de barras, todas las muestras se agrupan y se cargan en el MiSeq. Se esperan entre cinco mil y diez mil lecturas en la región de interés. A continuación, se ejecutan programas informáticos para mapear las lecturas y determinar la secuencia precisa de cada edición. A continuación, el programa cuenta el número de lecturas naturales (sin editar) y proporciona un desglose del tipo de edición realizada para todas las lecturas editadas (evaluación del número de pares de bases añadidos y/o eliminados en la región prevista de edición).
A continuación, se llevó a cabo un experimento para eliminar el gen diana 4, que codifica una glicoproteína de tipo 11 unida a la membrana, introduciendo Cas9 con un ARNgu dirigido al exón 2 del gen diana 4 en hepatocitos primarios aislados de ratones silvestres (naturales). Se probaron cinco ARNgu diferentes (guías 1-5). Los complejos de ribonucleoproteína Cas9/ARNgu (RNP) se introdujeron en las células a través de lipofectamina. A continuación, se evaluó la unión de extremos no homólogos mediante la secuenciación de próxima generación (NGS) para medir las frecuencias de indel en el locus del gen diana 4. La edición porcentual es una medida del total de eventos NHEJ sobre el total de lecturas. Se consideran eventos NHEJ todas las ediciones (inserción, deleción, cambio de base) que se producen en los 20 pares de bases antes y después del sitio del corte. El porcentaje de edición de las guías 1 a 5 fue el siguiente: 35,4 %, 37,4 %, 43,8 %, 51,2 % y 55,8 %, respectivamente (datos no mostrados).
A continuación, se llevó a cabo un experimento para inactivar el gen diana 4in vivointroduciendo los mismos cinco ARNgu en ratones Cas9 separados con casete eliminado (MAID2600) mediante AAV8. Específicamente, las guías individuales expresadas por un promotor U6 se empaquetaron en AAV8 y se introdujeron en ratones Cas9 con casete eliminado de 6 a 12 semanas mediante inyección en la vena de la cola. La carga viral introducida estuvo entre 1 * 1011 y 1 * 1012, en un volumen aproximado de 50-100 pl. Los hígados se extrajeron 3-4 semanas después de la inyección. El porcentaje de edición se calculó tal como estaba en los hepatocitos primarios y se muestra en la figura 8A. Los niveles de edición fueron consistentes y, de hecho, superiores a los niveles de edición observados en los hepatocitos primarios. También se probaron los niveles de expresión del ARNm transcrito del gen diana 4. Como se muestra en la figura 8B, cada ARNg redujo los niveles relativos de ARNm transcritos del gen diana 4 en los hígados recolectados 3-4 semanas después de la inyección.
También se realizaron experimentos para probar el porcentaje de edición en varios otros genes diana del hígado. En cada experimento, la edad de los ratones fue de aproximadamente 6-12 semanas. Para cada gen diana, se diseñaron cinco ARN guía diferentes contra exones críticos. Los ARN guía se suministraron mediante AAV8 mediante inyección en la vena de la cola con cargas virales de entre 1 * 1011 y 1 * 1012 en un volumen aproximado de 50-100 pl. Los hígados se extrajeron 3-4 semanas después de la inyección. El porcentaje de edición se determinó como se ha explicado anteriormente. El porcentaje de edición en el hígado de ratones Cas9 con casete eliminado (MAID2600) a través del suministro de ARNg de AAV8 se muestra en la tabla 12. El mejor ARNg para cada gen resultó en una edición del 48 %-70 % en el hígadoin vivo.
Tabla 12. Porcentaje de edición en el hígado.
Ejemplo 2. Validación de la inducibilidad de ratones preparados para Cas9
El alelo LSL-Cas9 descrito en el ejemplo 1 (MAID2599) incluye una región poliadenilada fuerte floxeada (lox-stop-lox, o LSL) situada aguas arriba de la secuencia codificante de Cas9. Antes de la deleción del casete por la acción de la recombinasa Cre, el gen de resistencia a la neomicina normalmente se transcribirá y traducirá de manera eficiente; sin embargo, el CDS Cas9 normalmente no se expresará debido a la presencia de una fuerte región poli(A), que puede bloquear eficazmente la transcripción completa. Tras la eliminación del casete neo por la acción de la recombinasa Cre, el ARNm híbrido para las proteínas Cas9 y GFP normalmente se expresará constitutivamente por el promotorRosa26.Esto hace que el alelo Cas9 sea inducible. Esto es beneficioso por varias razones. La posibilidad de editar algunos genes en ciertos tejidos (p. ej., las células inmunitarias) puede ser perjudicial y provocar una respuesta inmunitaria. Además, en determinadas circunstancias, la mutación de un gen en todo el individuo diana puede ser letal, mientras que la mutación del gen en un tipo de tejido o célula específico sería beneficiosa. La naturaleza inducible del alelo MAID2599 permite una mayor especificidad en cuanto a qué tejido y tipo de célula se están editando mediante solo la activación de Cas9 de una manera específica de tejido o célula.
Para probar la inducibilidad de la expresión de Cas9 en el hígadoin vivo,se formularon nanopartículas lipídicas (LNP) que contenían el ARNm de la recombinasa Cre en el Precision Nanosystems Benchtop NanoAssmblr. El ARNm de Cre de Trilink (n.° de cat. 7211) se diluyó en citrato de sodio 10 mM y se combinó a través del casete NanoAssemblr a 3:1 con la combinación de lípidos de un lípido catiónico, DSPC, colesterol y PEG-DMG en una relación molar de 50:10:38,5:1,5. Esta formulación es absorbida fácilmente por el hígado. El LNP-Cre resultante se inyectó a través de la vena de la cola de ratones LSL-Cas9 (MAID2599) a 1 mg/kg. En los ratones de control, no se inyectó LNP-Cre. Después de 1 semana, los ratones se sacrificaron y se extrajeron los órganos para el análisis Western utilizando el anticuerpo monoclonal anti-Cas9 (7A9) (Invitrogen Cat n.° MA5-23519) y el anticuerpo monoclonal anti-Actin (C4) (Millipore Sigma Cat n.° MAB1501). Los órganos de ratones Cas9 con casete eliminado (MAID2600) se utilizaron como control positivo. En estos ratones, la recombinasa Cre ya había eliminado el casete de LSL. Los resultados se muestran en la figura 9, que muestra la prueba de concepto para la activación de Cas9 específica para el hígado con el suministro de LNP-Cre para la edición de genes específica para el hígado.
La inducibilidad de la edición génica mediada por Cas9 se probó entonces invivo.El LNP-Cre se formuló como se ha descrito anteriormente. A los ratones se les administró una dosis de LNP-Cre y AAV8-ARNg dirigidos al gen diana 3 (inyección conjunta mediante inyección en la vena de la cola) en los siguientes grupos: (1) 3 ratones LSL-Cas9 tratados con LNP-Cre y AAV8-ARNg; (2) 3 ratones LSL-Cas9 tratados con LNP-Cre y<p>B<s>; (3) 3 ratones LSL-Cas9 tratados con PBS y AAV8-ARNg; (4) 3 ratones LSL-Cas9 tratados solo con PBS; (5) 3 ratones Cas9 con casete eliminado tratados con LNP-Cre; (6) 3 ratones Cas9 con casete eliminado tratados con AAV8-ARNg; (7) 3 ratones Cas9 con casete eliminado tratados con PBS; y (8) 3 ratones naturales (sin tratar). En los grupos en los que se suministró LNP-Cre, se suministró a una concentración de 1 mg/kg. En los grupos en los que se suministró AAV8-ARNg, se suministró a una carga viral de aproximadamente 2x1o11. Una y tres semanas después de la inyección, se extrajo sangre a los ratones para determinar la química sérica y medir los niveles séricos circulantes de la proteína diana 3. A las tres semanas, también se recolectaron los tejidos para la NGS y para el análisis Western. Los niveles séricos de la proteína diana 3 se midieron mediante ELISA. Los resultados se muestran en la figura 10. El suministro de LNP-Cre a ratones LSL-Cas9 junto con AAV8-ARNg dio como resultado una disminución de los niveles séricos de la proteína diana 3, consistentes con la disminución observada en ratones Cas9 con casetes eliminados en los que se suministró AAV8-ARNg. Estos resultados del ELISA fueron consistentes con los resultados del NGS para la edición porcentual en el gen diana 3 en los hígados aislados de los ratones 3 semanas después de la inyección.Véasela figura 11.
A continuación, los ratones LSL-Cas9 se cruzaron con ratones con albúmina-Cre de Jax (3601-Tg (Alb-Cre)21Mgn; MAID3601) en la que el promotor de albúmina está unido operativamente a la secuencia codificante de la recombinasa Cre e impulsa su expresión en el hígado. Tras el cruce, se extrajeron varios tejidos de los ratones para el análisis de membrana de Western. Los tejidos correspondientes se recolectaron de ratones LSL-Cas9 que no se cruzaron con los ratones con albúmina-CRE. A continuación, se realizaron análisis de membrana de Western que midieron la expresión de Cas9 en el hígado y el cerebro. Se utilizó actina como control de carga. El tamaño previsto de Cas9 fue de 150,48 kD y el tamaño previsto de la actina fue de 41,25 kD. Se utilizaron 17,5 |jg de lisados de proteínas hepáticas y lisados de proteínas cerebrales. Se utilizó TruCut v2 Cas9 (17,5 jg ) como control positivo. Como se muestra en la figura 12A, la expresión de Cas9 se observó en los hígados de ratones LSL-Cas9/Alb-Cre pero no en los hígados de ratones LSL-Cas9. La expresión de Cas9 no se observó en los tejidos cerebrales de ninguno de los ratones(véasela figura 12B), lo que confirma que la expresión de Cas9 se indujo específicamente en el hígado.
Se realizó un experimento para probar la edición génica mediada por Cas9in vivoen estos ratones. El experimento incluyó cinco grupos de ratones de 8-12 semanas a los que se les inyectó AAV8-ARNg dirigido al gen diana 3 mediante una inyección en la vena de la cola: (1) 3 ratones LSL-Cas9:Alb-Cre (MAID2599 Het, MAID3601 Het); (2) 3 ratones naturales: ALB-Cre (MAID2599 naturales, MAID3601 Het); (3) 3 ratones LSL-Cas9:naturales (MAID2599 Het, MAID3601 naturales); (4) 3 ratones Cas9 (MAID2600 Het u Hom); y (5) 3 ratones 75/25 (50500 naturales). Los ratones de cada grupo también sirvieron como controles a los que no se les inyectó AAV8-ARNg. En los grupos en los que se suministró AAV8-ARNg, se suministró a una carga viral de aproximadamente 2X1011. Una semana después de la inyección, se desangró a los ratones para la química sérica y los ELISA. Tres semanas después de la inyección, se desangró a los ratones y se extrajeron los tejidos. Los resultados se muestran en la figura 13. El cruce de los ratones LSL-Cas9 con los ratones albúmina-Cre y después la inyección de AAV8-ARNg dio como resultado una disminución de los niveles séricos de la proteína diana 3, consistentes con la disminución observada en ratones Cas9 con casetes eliminados en los que se suministró AAV8-ARNg.
El sistema de ratón preparado para Cas9 descrito en la presente memoria es capaz de inducir una edición génica más sólida que otros métodos que se basan en la introducción exógena de Cas9. Además, el sistema puede expresar condicionalmente Cas9 basándose en la deleción de un casete de neomicina. Al combinar este sistema con diversas líneas de ratón delecionadoras de Cre, se puede controlar el momento de la edición del genoma inducida por Cas9 y se puede proporcionar la expresión de Cas9 específica para el tejidoin vivo.

Claims (19)

  1. REIVINDICACIONES
    i .Un método para probar la capacidad de una nucleasa CRISPR/Cas9 para modificar un locus genómico dianain vivo,que comprende:
    (a) introducir en un animal no humano que es un ratón o una rata un ARN guía diseñado para dirigirse a una secuencia diana de ARN guía en el locus genómico diana,
    en donde el ratón o la rata comprenden un casete de expresión de Cas9 integrado genómicamente que comprende una secuencia codificante para una proteína Cas9 que comprende además una o más señales de localización nuclear, en donde el casete de expresión de Cas9 está integrado en un locusRosa26,y en donde el casete de expresión de Cas9 está integrado en el primer intrón del locusRosa26,y en donde el ARN guía se introduce mediante el suministro mediado por virus adenoasociados (AAV), en donde el AAV es un AAV8 suministrado al ratón o a la rata mediante inyección intravenosa; y
    (b) evaluar la modificación del locus genómico diana en el hígado del ratón o la rata.
  2. 2. El método de la reivindicación 1, en donde un ácido nucleico donante exógeno se introduce en el paso (a), en donde el ácido nucleico donante exógeno se diseña para recombinarse con el locus genómico diana, opcionalmente en donde el ácido nucleico donante exógeno es un oligodesoxinucleótido monocatenario (ssODN).
  3. 3. El método de la reivindicación 1 o 2, en donde el animal no humano es el ratón.
  4. 4. El método de cualquier reivindicación anterior, en donde:
    (I) el locus genómico diana comprende un gen diana, y el paso (b) comprende medir la expresión del gen diana o la actividad de una proteína codificada por el gen diana; y/o
    (II) el paso (b) comprende secuenciar el locus genómico diana en una o más células aisladas del ratón o la rata; y/o
    (III) el paso (b) comprende aislar un órgano o tejido diana del ratón o la rata y evaluar la modificación del locus genómico diana en el órgano o tejido diana, opcionalmente en donde el paso (b) comprende evaluar la modificación del locus genómico diana en dos o más tipos de células diferentes dentro del órgano o tejido diana; y/o
    (IV) el paso (b) comprende aislar un órgano o tejido no diana del ratón o la rata y evaluar la modificación del locus genómico diana en el órgano o tejido no diana.
  5. 5. El método de cualquier reivindicación anterior, en donde la proteína Cas9 comprende una etiqueta proteica.
  6. 6. El método de cualquier reivindicación anterior, en donde el casete de expresión de Cas9 comprende además una señal de poliadenilación aguas arriba de la secuencia codificante para la proteína Cas9, en donde la señal de poliadenilación está flanqueada por sitios de reconocimiento de recombinasas, y en donde la señal de poliadenilación en el casete de expresión de Cas9 se ha extirpado de manera específica para un tejido en el hígado.
  7. 7. El método de la reivindicación 6, en donde la recombinasa que reconoce los sitios de reconocimiento de la recombinasa en el casete de expresión de Cas9 es una recombinasa Cre, opcionalmente en donde el ratón o la rata comprenden además un casete de expresión de la recombinasa Cre integrado genómicamente que comprende una secuencia codificante de la recombinasa Cre unida operativamente a un promotor específico de tejido, y opcionalmente en donde la secuencia codificante de la recombinasa Cre está unida operativamente a un promotor de albúmina de rata o a un promotor de albúmina de ratón.
  8. 8. El método de una cualquiera de las reivindicaciones 1-5, en donde el casete de expresión de Cas9 comprende además una señal de poliadenilación aguas arriba de la secuencia codificante de la proteína Cas9, en donde la señal de poliadenilación está flanqueada por sitios de reconocimiento de recombinasas, y en donde el método comprende además la introducción de una recombinasa en el ratón o la rata de una manera específica de un tejido, opcionalmente en donde la recombinasa se introduce mediante el suministro mediado por virus adenoasociados (AAV) o suministro mediado por nanopartículas lipídicas (LNP).
  9. 9. El método de cualquier reivindicación anterior, en donde el casete de expresión de Cas9 comprende además una secuencia codificante de la proteína fluorescente, opcionalmente en donde el casete de expresión de Cas9 comprende un ácido nucleico multicistrónico que comprende la secuencia codificante para la proteína Cas9 y la secuencia codificante de la proteína fluorescente separadas por un sitio de entrada al ribosoma interno interviniente (IRES) o una secuencia codificante del péptido 2A interviniente, y opcionalmente en donde el ácido nucleico multicistrónico en el casete de expresión de Cas9 comprende la secuencia codificante para la proteína Cas9 y una secuencia codificante de proteína fluorescente verde separada por una secuencia codificante del péptido P2A interviniente.
  10. 10.El método de una cualquiera de las reivindicaciones 1-8, en donde el casete de expresión de Cas9 además no comprende una secuencia codificante de proteínas fluorescentes.
  11. 11. El método de cualquier reivindicación anterior, en donde el extremo 5' del casete de expresión de Cas9 comprende además una secuencia de empalme en 3'.
  12. 12. El método de cualquier reivindicación anterior, en donde el casete de expresión de Cas9 está unido operativamente a un promotor endógeno.
  13. 13. El método de una cualquiera de las reivindicaciones 1-11, en donde el casete de expresión de Cas9 está unido operativamente a un promotor constitutivo exógeno.
  14. 14. El método de cualquier reivindicación anterior, en donde el casete de expresión de Cas9 codifica una proteína que comprende la secuencia expuesta en la id. de sec. n.°: 13, 16, 19 o 22, opcionalmente en donde el casete de expresión de Cas9 comprende la secuencia expuesta en la id. de sec. n.°: 28, 29, 30 o 31, y opcionalmente en donde el casete de expresión de Cas9 comprende la secuencia expuesta en la id. de sec. n.°: 1, 12, 14, 15, 17, 18, 20 o 21.
  15. 15. El método de cualquier reivindicación anterior, en donde el ratón o la rata son heterocigotos para el casete de expresión de Cas9.
  16. 16. El método de una cualquiera de las reivindicaciones 1-14, en donde el ratón o la rata es homocigoto para el casete de expresión de Cas9.
  17. 17. El método de cualquier reivindicación anterior, en donde el animal no humano es el ratón, y en donde el casete de expresión de Cas9 está unido operativamente a un promotorRosa26endógeno y comprende de 5' a 3': (i) una secuencia de empalme en 3'; y (ii) la secuencia codificante para la proteína Cas9 que comprende además una o más señales de localización nuclear.
  18. 18. Un método para optimizar la capacidad de una nucleasa CRISPR/Cas9 para modificar un locus genómico dianain vivo,que comprende:
    (1) realizar el método de cualquier reivindicación anterior por primera vez en un primer ratón o rata; (II) cambiar una variable y realizar el método del paso (I) por segunda vez con la variable cambiada en un segundo ratón o rata; y
    (III) comparar la modificación del locus genómico diana en el paso (I) con la modificación del locus genómico diana en el paso (II), y seleccionar el método que da como resultado la modificación del locus genómico diana con uno o más de mayor eficacia, mayor precisión, mayor consistencia o mayor especificidad.
  19. 19. El método de la reivindicación 18, en donde:
    (1 )la variable cambiada en el paso (II) es la concentración o cantidad del ARN guía introducido en el ratón o la rata;
    (2) la variable cambiada en el paso (II) es el ARN guía introducido en el ratón o la rata;
    (3) en donde el método comprende la introducción de un ácido nucleico donante exógeno, y en donde la variable cambiada en el paso (II) es el método de suministro o la vía de suministro para introducir el ácido nucleico donante exógeno en el ratón o la rata;
    (4) en donde el método comprende introducir un ácido nucleico donante exógeno, y la variable cambiada en el paso (II) es la concentración o cantidad del ácido nucleico donante exógeno introducido en el ratón o la rata;
    (5) en donde el método comprende introducir un ácido nucleico donante exógeno, y la variable cambiada en el paso (II) es la concentración o cantidad del ARN guía introducido en el ratón o la rata en relación con la concentración o cantidad de ácido nucleico donante exógeno introducido en el ratón o la rata; o
    (6) en donde el método comprende introducir un ácido nucleico donante exógeno, y la variable cambiada en el paso (II) es el ácido nucleico donante exógeno introducido en el ratón o la rata.
ES18759200T 2017-07-31 2018-07-31 Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome Active ES3033963T3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762539275P 2017-07-31 2017-07-31
PCT/US2018/044615 WO2019028032A1 (en) 2017-07-31 2018-07-31 EMBRYONIC STEM CELLS OF TRANSGENIC MOUSE CASES AND MICE AND USES THEREOF

Publications (1)

Publication Number Publication Date
ES3033963T3 true ES3033963T3 (en) 2025-08-11

Family

ID=63350596

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18759200T Active ES3033963T3 (en) 2017-07-31 2018-07-31 Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome

Country Status (13)

Country Link
US (3) US11130999B2 (es)
EP (1) EP3585159B1 (es)
JP (2) JP7359753B2 (es)
KR (2) KR102712142B1 (es)
CN (2) CN110891420B (es)
AU (2) AU2018309716B2 (es)
BR (1) BR112020001364A2 (es)
CA (1) CA3067872A1 (es)
ES (1) ES3033963T3 (es)
IL (1) IL272334A (es)
MX (1) MX2020001178A (es)
SG (1) SG11201912235PA (es)
WO (1) WO2019028032A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3585159B1 (en) 2017-07-31 2025-05-14 Regeneron Pharmaceuticals, Inc. Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome
KR102683424B1 (ko) 2019-03-18 2024-07-10 리제너론 파마슈티칼스 인코포레이티드 타우 응집과 관련된 유전적 취약성을 식별하기 위한 CRISPR/Cas 드랍아웃 스크리닝 플랫폼
KR20240126075A (ko) 2019-03-18 2024-08-20 리제너론 파마슈티칼스 인코포레이티드 타우 시딩 또는 응집의 유전적 변형제를 식별하기 위한 CRISPR/Cas 스크리닝 플랫폼
CA3133361A1 (en) 2019-04-03 2020-10-08 Regeneron Pharmaceuticals, Inc. Methods and compositions for insertion of antibody coding sequences into a safe harbor locus
WO2020236597A1 (en) * 2019-05-17 2020-11-26 Massachusetts Institute Of Technology Engineered post-poly a signal rna and uses thereof
US11845957B2 (en) 2019-06-14 2023-12-19 Regeneron Pharmaceuticals, Inc. Models of tauopathy
AU2020379046B2 (en) 2019-11-08 2025-03-13 Regeneron Pharmaceuticals, Inc. CRISPR and AAV strategies for X-linked juvenile retinoschisis therapy
AU2021231783A1 (en) 2020-03-04 2022-10-27 Regeneron Pharmaceuticals, Inc. A rodent model of B4GALT1-mediated functions
US12152258B2 (en) * 2020-04-20 2024-11-26 Integrated Dna Technologies, Inc. Optimized protein fusions and linkers
AU2022277688A1 (en) * 2021-05-20 2023-12-21 Synteny Therapeutics, Inc. Genomic safe harbors
CN113999873B (zh) * 2021-12-31 2022-05-20 北京市疾病预防控制中心 一种基因修饰的非人动物的构建方法及其应用
WO2023212616A2 (en) * 2022-04-27 2023-11-02 Alpha Teknova, Inc. Detection, quantification, and expression analysis of full viral capsids
US20250302998A1 (en) * 2022-05-09 2025-10-02 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023235725A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr-based therapeutics for c9orf72 repeat expansion disease
CN115992178A (zh) * 2022-08-08 2023-04-21 首都医科大学附属北京天坛医院 核心蛋白聚糖转基因小鼠的制备方法及应用
CN118086394B (zh) * 2024-04-24 2024-07-12 中国农业科学院北京畜牧兽医研究所 猪脂肪组织发育示踪系统及应用

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
US8106255B2 (en) 2002-01-23 2012-01-31 Dana Carroll Targeted chromosomal mutagenasis using zinc finger nucleases
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
AU2003298574B2 (en) 2002-09-05 2008-04-24 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US20080131962A1 (en) 2006-05-25 2008-06-05 Sangamo Biosciences, Inc. Engineered cleavage half-domains
WO2006033859A2 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
SI1802193T1 (sl) 2004-10-19 2014-08-29 Regeneron Pharmaceuticals, Inc. Postopek za generiranje miši, homozigotne za genetsko modifikacijo
US7951925B2 (en) 2006-05-25 2011-05-31 Sangamo Biosciences, Inc. Methods and compositions for gene inactivation
JP4692417B2 (ja) 2006-06-30 2011-06-01 富士ゼロックス株式会社 画像形成装置
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
CA2684378C (en) 2007-04-26 2016-11-29 Sangamo Biosciences, Inc. Targeted integration into the ppp1r12c locus
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
KR20100120226A (ko) 2008-04-11 2010-11-12 유티씨 파워 코포레이션 매니폴드 섬프를 갖는 바이폴라 플레이트 및 연료 전지
US9567573B2 (en) 2010-04-26 2017-02-14 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using nucleases
EP2571512B1 (en) 2010-05-17 2017-08-23 Sangamo BioSciences, Inc. Novel dna-binding proteins and uses thereof
CA2826864A1 (en) * 2011-03-07 2012-09-13 Fondazione Telethon Tfeb variants and uses thereof
EP3498833B1 (en) 2011-09-21 2023-08-16 Sangamo Therapeutics, Inc. Methods and compositions for regulation of transgene expression
AU2012328682B2 (en) 2011-10-27 2017-09-21 Sangamo Therapeutics, Inc. Methods and compositions for modification of the HPRT locus
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
PL2847335T3 (pl) 2012-04-25 2019-01-31 Regeneron Pharmaceuticals, Inc. Celowanie dużymi wektorami do celowania wspomagane nukleazą
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
CA3034794A1 (en) 2012-12-06 2014-06-12 Sigma-Aldrich Co. Llc Crispr-based genome modification and regulation
BR112015013784A2 (pt) * 2012-12-12 2017-07-11 Massachusetts Inst Technology aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
JP6700788B2 (ja) 2012-12-17 2020-05-27 プレジデント アンド フェローズ オブ ハーバード カレッジ Rna誘導性ヒトゲノム改変
AU2014218931C1 (en) 2013-02-20 2020-05-14 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
WO2014131833A1 (en) 2013-02-27 2014-09-04 Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) Gene editing in the oocyte by cas9 nucleases
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
CN113563476A (zh) 2013-03-15 2021-10-29 通用医疗公司 遗传和表观遗传调节蛋白至特定基因组基因座的rna引导的靶向
EP4286517A3 (en) 2013-04-04 2024-03-13 President and Fellows of Harvard College Therapeutic uses of genome editing with crispr/cas systems
RS58255B1 (sr) 2013-04-16 2019-03-29 Regeneron Pharma Ciljana modifikacija genoma pacova
US20140349405A1 (en) 2013-05-22 2014-11-27 Wisconsin Alumni Research Foundation Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
BR112015031611A2 (pt) 2013-06-17 2017-12-12 Massachusetts Inst Technology aplicação, manipulação e otimização de sistemas, métodos e composições para direcionamento e modelação de doenças e distúrbios de células pós-mitóticas
KR20240172759A (ko) 2013-06-17 2024-12-10 더 브로드 인스티튜트, 인코퍼레이티드 간의 표적화 및 치료를 위한 CRISPR­Cas 시스템, 벡터 및 조성물의 전달 및 용도
US20160264982A1 (en) 2013-07-16 2016-09-15 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Method for plant genome site-directed modification
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
ES3013744T3 (en) 2013-09-18 2025-04-15 Kymab Ltd Methods, cells and organisms
CN105592695B (zh) 2013-09-23 2018-04-10 瑞泽恩制药公司 具有人源化信号调节蛋白基因的非人动物
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
AU2014337248B2 (en) 2013-10-17 2020-09-24 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
KR102170502B1 (ko) 2013-12-11 2020-10-28 리제너론 파마슈티칼스 인코포레이티드 게놈의 표적화된 변형을 위한 방법 및 조성물
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
EP3110454B1 (en) 2014-02-24 2020-11-18 Sangamo Therapeutics, Inc. Methods and compositions for nuclease-mediated targeted integration
CN106232803A (zh) 2014-02-27 2016-12-14 孟山都技术公司 用于定点基因组修饰的组合物和方法
CN103911376B (zh) * 2014-04-03 2017-02-15 黄行许 CRISPR‑Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA
CA2949697A1 (en) 2014-05-20 2015-11-26 Regents Of The University Of Minnesota Method for editing a genetic sequence
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
JP6930834B2 (ja) 2014-06-16 2021-09-01 ザ・ジョンズ・ホプキンス・ユニバーシティー H1プロモーターを用いるcrisprガイドrnaの発現のための組成物および方法
EP3354732B1 (en) 2014-06-23 2020-01-08 Regeneron Pharmaceuticals, Inc. Nuclease-mediated dna assembly
US20150376586A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
HUE041584T2 (hu) 2014-06-26 2019-05-28 Regeneron Pharma Célzott genetikai módosítások és alkalmazási módszerek és készítmények
EP2966170A1 (en) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
CN106794141B (zh) 2014-07-16 2021-05-28 诺华股份有限公司 将核酸包封在脂质纳米粒主体中的方法
CN104178461B (zh) * 2014-08-14 2017-02-01 北京蛋白质组研究中心 携带cas9的重组腺病毒及其应用
KR20170083534A (ko) 2014-09-19 2017-07-18 리제너론 파마슈티칼스 인코포레이티드 키메라 항원 수용체
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016049163A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
EP3212789B1 (en) 2014-10-31 2020-04-22 Massachusetts Institute of Technology Massively parallel combinatorial genetics for crispr
EP3215617B1 (en) 2014-11-07 2024-05-08 Editas Medicine, Inc. Systems for improving crispr/cas-mediated genome-editing
EP3221457B1 (en) 2014-11-21 2019-03-20 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modification using paired guide rnas
US20170266320A1 (en) 2014-12-01 2017-09-21 President And Fellows Of Harvard College RNA-Guided Systems for In Vivo Gene Editing
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
CN104498493B (zh) * 2014-12-30 2017-12-26 武汉大学 CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
CN113388670B (zh) 2015-01-09 2024-02-02 生物辐射实验室股份有限公司 检测基因组编辑
CN107429263A (zh) 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
WO2016123514A1 (en) 2015-01-29 2016-08-04 University Of Massachusetts Nanoparticle-protein complex for intracellular protein delivery
WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
WO2016137949A1 (en) 2015-02-23 2016-09-01 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
US20180110877A1 (en) 2015-04-27 2018-04-26 The Trustees Of The University Of Pennsylvania DUAL AAV VECTOR SYSTEM FOR CRISPR/Cas9 MEDIATED CORRECTION OF HUMAN DISEASE
US10179918B2 (en) 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
BR112018010158A2 (pt) 2015-11-20 2018-11-21 Regeneron Pharma roedor, polipeptídeo lag-3 humanizado, célula ou tecido, célula-tronco embrionária e embrião de roedor, métodos para produzir um roedor, para avaliar a eficácia antitumoral e as propriedades farmacocinéticas de uma droga
US20190075770A1 (en) 2015-12-18 2019-03-14 Japan Science And Technology Agency Genetic modification non-human organism, egg cells, fertilized eggs, and method for modifying target genes
CN105647968B (zh) 2016-02-02 2019-07-23 浙江大学 一种CRISPR/Cas9工作效率快速测试系统及其应用
CN117731805A (zh) 2016-03-30 2024-03-22 因特利亚治疗公司 用于crispr/cas成分的脂质纳米颗粒制剂
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
GB201619876D0 (en) 2016-11-24 2017-01-11 Cambridge Entpr Ltd Controllable transcription
CN110291198B (zh) 2016-12-08 2024-11-26 因特利亚治疗公司 经修饰的指导rna
US20180185516A1 (en) 2016-12-09 2018-07-05 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
WO2018112278A1 (en) 2016-12-14 2018-06-21 Ligandal, Inc. Methods and compositions for nucleic acid and protein payload delivery
WO2018132936A1 (en) 2017-01-17 2018-07-26 Guangzhou Institutes Of Biomedicine And Health, Chinese Academy Of Sciences Genetical alternation and disease modelling using cre-dependent cas9 expressing mammals
EP3585159B1 (en) 2017-07-31 2025-05-14 Regeneron Pharmaceuticals, Inc. Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
JP2021526804A (ja) 2018-06-08 2021-10-11 インテリア セラピューティクス,インコーポレイテッド 遺伝子編集のための修飾されたガイドrna
AU2019288373B2 (en) 2018-06-19 2025-05-29 The Board Of Regents Of The University Of Texas System Lipid nanoparticle compositions for delivery of mRNA and long nucleic acids

Also Published As

Publication number Publication date
SG11201912235PA (en) 2020-01-30
CN110891420A (zh) 2020-03-17
CN115074343A (zh) 2022-09-20
KR102780441B1 (ko) 2025-03-17
MX2020001178A (es) 2020-09-25
JP7549721B2 (ja) 2024-09-11
CN110891420B (zh) 2022-06-03
EP3585159C0 (en) 2025-05-14
AU2018309716B2 (en) 2024-11-21
AU2025200939A1 (en) 2025-02-27
BR112020001364A2 (pt) 2020-08-11
KR102712142B1 (ko) 2024-10-07
US20210392862A1 (en) 2021-12-23
EP3585159A1 (en) 2020-01-01
KR20200032693A (ko) 2020-03-26
JP7359753B2 (ja) 2023-10-11
US11866794B2 (en) 2024-01-09
EP3585159B1 (en) 2025-05-14
JP2020532952A (ja) 2020-11-19
US20190032155A1 (en) 2019-01-31
US20240093316A1 (en) 2024-03-21
AU2018309716A1 (en) 2020-01-16
RU2020105343A3 (es) 2021-11-11
CA3067872A1 (en) 2019-02-07
JP2023165953A (ja) 2023-11-17
IL272334A (en) 2020-03-31
KR20240145526A (ko) 2024-10-07
US11130999B2 (en) 2021-09-28
WO2019028032A1 (en) 2019-02-07
RU2020105343A (ru) 2021-09-02

Similar Documents

Publication Publication Date Title
ES3033963T3 (en) Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome
ES2962277T3 (es) Roedores que comprenden un locus Ttr humanizado y métodos de uso
US11021719B2 (en) Methods and compositions for assessing CRISPER/Cas-mediated disruption or excision and CRISPR/Cas-induced recombination with an exogenous donor nucleic acid in vivo
EP3592140A1 (en) Transcription modulation in animals using crispr/cas systems
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
WO2021195079A1 (en) Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use
US20230081547A1 (en) Non-human animals comprising a humanized klkb1 locus and methods of use
RU2782358C2 (ru) Экспрессирующие cas мышиные эмбриональные стволовые клетки и мыши и их применения
HK40018000A (en) Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome
HK40018000B (en) Method of testing the ability of a crispr/cas9 nuclease to modify a target genomic locus in vivo, by making use of a cas-transgenic mouse or rat which comprises a cas9 expression cassette in its genome
HK40018001A (en) Rodents comprising a humanized ttr locus and methods of use
HK40018001B (en) Rodents comprising a humanized ttr locus and methods of use