[go: up one dir, main page]

WO2004048566A1 - Rna干渉の標的塩基配列検索方法、rna干渉を生じさせるポリヌクレオチドの塩基配列設計方法、2本鎖ポリヌクレオチドの作製方法、遺伝子の発現抑制方法、塩基配列処理装置、塩基配列処理方法をコンピュータに実行させるプログラム、記録媒体、および、塩基配列処理システム - Google Patents

Rna干渉の標的塩基配列検索方法、rna干渉を生じさせるポリヌクレオチドの塩基配列設計方法、2本鎖ポリヌクレオチドの作製方法、遺伝子の発現抑制方法、塩基配列処理装置、塩基配列処理方法をコンピュータに実行させるプログラム、記録媒体、および、塩基配列処理システム Download PDF

Info

Publication number
WO2004048566A1
WO2004048566A1 PCT/JP2003/014893 JP0314893W WO2004048566A1 WO 2004048566 A1 WO2004048566 A1 WO 2004048566A1 JP 0314893 W JP0314893 W JP 0314893W WO 2004048566 A1 WO2004048566 A1 WO 2004048566A1
Authority
WO
WIPO (PCT)
Prior art keywords
base sequence
sequence
seq
base
bases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2003/014893
Other languages
English (en)
French (fr)
Inventor
Kaoru Saigo
Kumiko Tei
Yuki Naito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BIO-THINK TANK Co Ltd
Original Assignee
BIO-THINK TANK Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BIO-THINK TANK Co Ltd filed Critical BIO-THINK TANK Co Ltd
Priority to EP03774133A priority Critical patent/EP1571209B1/en
Priority to US10/535,851 priority patent/US20060275762A1/en
Priority to CA002511481A priority patent/CA2511481A1/en
Priority to JP2004555000A priority patent/JP3839453B2/ja
Priority to CN2003801091084A priority patent/CN1742086B/zh
Priority to AU2003284624A priority patent/AU2003284624B2/en
Publication of WO2004048566A1 publication Critical patent/WO2004048566A1/ja
Anticipated expiration legal-status Critical
Priority to AU2010201099A priority patent/AU2010201099A1/en
Priority to US12/908,393 priority patent/US20110033860A1/en
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1131Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • C12N2310/111Antisense spanning the whole gene, or a large part of it
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering nucleic acids [NA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • a method for searching for a target base sequence for RNA interference a method for designing a base sequence of a polynucleotide that causes RNA interference, a method for preparing a double-stranded polynucleotide, a method for suppressing gene expression, a base sequence processing device, and a base sequence processing method to a computer Program to be executed, recording medium, and base sequence processing system
  • the present invention relates to RNA interference (RNA int erfer en c e), and more particularly, to RNA interference, which improves the efficiency of tests and production utilizing RNA interference.
  • RNA interference RNA int erfer en c e
  • the present invention relates to a method for designing a polynucleotide sequence to be synthesized.
  • R a polynucleotide sequence to be synthesized.
  • RNAi NA interference
  • the present invention relates to a base sequence processing apparatus, a program for causing a computer to execute a base sequence processing method, a recording medium, and a base sequence processing system, and in particular, from a base sequence of a target gene of RNA interference to a target gene.
  • the present invention relates to a base sequence processing apparatus capable of efficiently selecting a base sequence that causes RNA interference, a program for causing a computer to execute a base sequence processing method, a recording medium, and a base sequence processing system.
  • RNA interference is a double-stranded RNA consisting of a sense RNA and an antisense RNA homologous to a specific region of a gene to be inhibited (hereinafter referred to as “ds RNA”).
  • ds RNA antisense RNA homologous to a specific region of a gene to be inhibited
  • the phenomenon of interference destruction of a homologous part of a certain mRNA was first proposed in 1998 in experiments using nematodes. However, in mammals, introduction of long ds RNA of about 30 base pairs or more into cells induces interferon response, and the cells die by apoptosis, so that it was difficult to use the RNAi method. On the other hand, it has been shown that RNA interference can occur in mouse embryos and cultured mammalian cells.
  • siRNA short double-stranded RNA
  • RNAi method is a technology that is expected to have various applications.
  • dsRNA and siRNA homologous to a particular region of a gene show RNA interference effects on most sequences, whereas they are randomly selected in mammals. It does not show 70-80% RNA interference effect of the (21 base) siRNA. This is a major problem when performing gene function analysis using the RNAi method in mammals.
  • RNA synthesis requires cost and time, synthesizing useless siRNA to perform RNA interference is not possible without further research on RNA interference and numerous studies using RNA interference. It was a factor that hindered the spread of usage.
  • the present inventors studied a method for easily obtaining siRNA, which is one of the parts requiring the most labor, time, and cost when using the RNAi method. Advanced. Since the preparation of siRNA is particularly problematic in mammals, the present inventors attempted to identify the sequence regularity of siRNA effective for RNA interference using a cultured mammalian cell line. As a result, they found that the sequence of an effective siRNA had a certain regularity, and completed the present invention. That is, the present invention is as follows. [1] A method for searching for a target nucleotide sequence for RNA interference, wherein a sequence site according to the following rules (a) to (d) is searched from the nucleotide sequence of the target gene for RNA interference.
  • the base at the 3 ′ end is adenine, thymine, or perilla.
  • the terminal base is guanine or cytosine.
  • the number of bases is a number that can cause RNA interference without causing cytotoxicity.
  • at least three or more of the seven bases are one or more selected from the group consisting of adenine, thymine and peracyl, and the target base according to the above (1). How to search for an array.
  • a base sequence of a polynucleotide that causes RNA interference by searching a base sequence of the target gene for a base sequence according to the following rules (a) to (d) and designing a base sequence homologous to the searched base sequence: Array design method.
  • the terminal base is adenine, thymine or peracyl.
  • the terminal base is guanine or cytosine.
  • the number of bases is a number that can cause RNA interference without causing cytotoxicity.
  • at least 3 bases out of 7 bases are one or more selected from the group consisting of adenine, thymine and wool, The nucleotide sequence design method according to the above [4].
  • One strand is formed by providing an overhang at the 3rd end of the base sequence contained in the base sequence of the target gene and homologous to the base sequence according to the rules (a) to (d) below,
  • the other chain is formed by providing an overhang at the 3 'end of the sequence complementary to the base sequence homologous to the above-mentioned defined sequence,
  • a method for producing a double-stranded polynucleotide comprising synthesizing a double-stranded polynucleotide designed such that the number of bases in each strand is 15 to 30.
  • the terminal base is adenine, thymine or peracyl.
  • the terminal base is guayun or cytosine.
  • the number of bases is a number that can cause RNA interference without causing cytotoxicity.
  • a sequence of 1-38 bases according to the following rules (a) to (d) is searched from the base sequence of the target gene for RNA interference, and one strand is searched for the base sequence of the target gene. It is formed by providing an overhang at the terminal 3 of the base sequence homologous to the specified sequence according to the rules (a) to (d) below, and the other strand is a base sequence homologous to the specified sequence.
  • a double-stranded polynucleotide which is formed by providing an overhang portion at the 3 'end of a sequence complementary to the sequence and synthesized so that the number of bases in each chain is 15 to 30.
  • the base at the 3 ′ ′ end is adeyun, thymine or peracyl.
  • the terminal base is guanine or cytosine.
  • one or more bases selected from the group consisting of adenine, thymine and uracil are litz.
  • the number of bases is a number that can cause RNA interference without causing cytotoxicity.
  • One strand is formed by providing an overhang at the 3rd end of the base sequence contained in the base sequence of the target gene and homologous to the specified sequence according to the following rules (a) to (d),
  • the other strand was formed by providing an overhang at the 3 ′ end of the sequence complementary to the base sequence homologous to the above-mentioned defined sequence, and was designed such that the number of bases in each strand was 15 to 30. Synthesizing a single-stranded polynucleotide,
  • a method for suppressing gene expression comprising:
  • the terminal base is adenine, thymine or peracyl.
  • the terminal base is guanine or cytosine.
  • a partial base sequence creating means for acquiring base sequence information of a target gene for RNA interference and creating partial base sequence information that is a sequence site having a predetermined number of bases in the base sequence information; 3, the terminal base determining means for determining whether or not the terminal at the terminal is adenine, thymine, or peracyl in the partial base sequence information prepared by the base sequence preparing means; 3, the terminal base determining means, and the partial base sequence preparing 5.
  • the terminal at the end is determined to be guanine or cytosine 5.
  • the terminal base determination means, and the partial base sequence creation means The base sequence information consisting of the above-mentioned 3 and 7 terminal bases of the above-mentioned partial base sequence information is:-One or more kinds selected from the group consisting of the above-mentioned adenine, the above-mentioned thymine, and the above-mentioned peracil JP determines mosquitoes ⁇ not the base is Ritsuchi of the nucleotide sequence information Created by the partial base sequence creating means based on the results determined by the constant base content determining means, the 3, terminal base determining means, the 5, terminal base determining means, and the specific base content determining means.
  • a base sequence processing unit comprising: a base sequence processing unit that selects base sequence information that specifically causes the RNA interference from the target base gene from the base sequence information obtained.
  • the partial base sequence creating means creates the partial base sequence information of the predetermined number of bases from a site corresponding to the coding region or the transcription region of the target gene in the base sequence information.
  • the partial base sequence creating means creates a common base sequence information for creating the partial base sequence information of the predetermined number of bases, which is common among a plurality of base sequence information derived from different organisms. [13] or characterized by further comprising means
  • the above-mentioned base sequence information which is composed of 7 bases, is one or more of the above-mentioned adenine, thymine, and peracyl selected from the group consisting of peracyl.
  • the base sequence processing apparatus according to any one of [13] to [15], wherein the base sequence information includes at least three bases or more.
  • the partial base sequence creating means further comprises an overhang site-containing base sequence creating means for creating the partial base sequence information including an overhang site, wherein [13] to [1] 7] The apparatus for processing a base sequence according to any one of [1] to [9].
  • the number of bases in the overhang site is 2, [1. 8] or the base sequence processing apparatus according to [19].
  • the same similar base sequence searching means for searching the same base sequence information identical or similar to the above specified sequence information from the other base sequence information, and the above similar base sequence searching means searched by the same similar base sequence searching means
  • An unrelated gene target evaluating means for evaluating whether or not the specified sequence information targets a gene unrelated to the target gene, based on the same or similar base sequence information.
  • the irrelevant gene target evaluation means comprises the base sequence information of the gene irrelevant to the target gene among the same or similar base sequence information searched by the same similar base sequence search means. And calculating the sum of the reciprocals of the values indicating the degree of the similarity based on the value indicating the degree of the similarity attached to the base sequence information of the gene irrelevant to the target gene. Sum reference standard target evaluation means for evaluating whether or not the specified sequence information targets the gene irrelevant to the target gene based on the calculation means and the sum calculated by the sum calculation means.
  • the base sequence processing apparatus according to [21], further comprising:
  • a partial base sequence creating step of obtaining base sequence information of a target gene for RNA interference and creating partial base sequence information that is a sequence site having a predetermined number of bases in the base sequence information, (3) determining whether or not the terminal at the terminal of the partial base sequence information created in the partial base sequence creating step is adenine, thymine, or peracil; (3) determining the terminal base; In the 5 ′ end base determination step of determining whether the base at the 5 ′ end of the partial base sequence information created in the sequence creation step is guayun or cytosine, and in the partial base sequence creation step One or two types selected from the group consisting of the above-mentioned adenine, the above-mentioned thymine, and the above-mentioned peracil, wherein the above-mentioned base sequence information consisting of the above-mentioned three and the terminal 7 bases of the above-mentioned partial base sequence information is prepared More than The specific base content determination step for determining whether or not the terminal
  • the client device includes the target gene. And a base sequence transmitting means for transmitting the base sequence information or the base sequence information to the base sequence processing device; and a 'specific sequence information specifically causing the RNA interference to the target gene, transmitted from the base sequence processing device.
  • a base sequence processing unit for obtaining the base sequence information corresponding to the name of the target gene transmitted from the client device, or the base sequence information transmitted from the client device.
  • the base sequence information consisting of the above-mentioned 3 and 7 terminal bases of the prepared partial base sequence information is one or two or more kinds selected from the group consisting of the adenine, the thymine, and the peracyl.
  • a specific base content determining step for determining whether or not the base is rich in the base sequence information, the 3, terminal base determining step, the 5, terminal base determining step, and the specific base content determining step Based on the results determined in step 2, a defined sequence for selecting, from the partial base sequence information created in the partial base sequence creation step, defined sequence information that specifically causes the RNA interference with the target gene,
  • a method of processing a base sequence comprising:
  • the partial base sequence creating step creates the partial base sequence information of the predetermined number of bases from a site corresponding to the coding region or the transcription region of the target gene in the base sequence information.
  • the step of creating a partial base sequence comprises creating a common base sequence for creating the partial base sequence information of the predetermined number of bases common to a plurality of pieces of base sequence information derived from different organisms.
  • the rich base sequence information is the base sequence information consisting of the seven bases, one or two or more selected from the group consisting of the adenine, the thymine, 'and the peracyl The salt according to any one of (26) to (28), wherein the base sequence information includes at least three or more bases.
  • Base sequence processing method is the base sequence processing method.
  • the step of preparing a partial base sequence further includes a step of preparing a base sequence containing an overhang site for preparing the above-mentioned partial base sequence information including an overhang site.
  • the nucleotide sequence processing method according to any one of
  • the same-similar base sequence searching step of searching the same base sequence information identical or similar to the above-mentioned prescribed sequence information from other base sequence information, and the above-mentioned same base sequence searched in the same similar base sequence searching step An unrelated gene target evaluation step of evaluating whether or not the specified sequence information targets a gene unrelated to the target gene based on the same or similar base sequence information.
  • the irrelevant gene target evaluation step includes the base sequence information of the gene irrelevant to the target gene among the same or similar base sequence information searched in the same or similar base sequence search step. And calculating the sum of the reciprocals of the values indicating the degree of the similarity based on the value indicating the degree of the similarity attached to the base sequence information of the gene irrelevant to the target gene. A summation criterion for evaluating whether or not the specified sequence information has the ability to target the gene irrelevant to the target gene based on the calculation step and the sum calculated in the sum calculation step.
  • the partial nucleotide sequence creation step comprises the steps of: The method according to (23), further comprising a region-designating base sequence creating step of creating the partial base sequence information of the predetermined number of bases from a site corresponding to the coding region or the transcription region. program.
  • the partial base sequence creating step is a common base sequence creating step of creating the partial base sequence information of the predetermined number of bases, which is common among a plurality of pieces of base sequence information derived from different organisms.
  • the rich base sequence information is the base sequence information consisting of the seven bases, wherein the one or two or more bases selected from the group consisting of the adenine, the thymine, and the peracil are The program according to any one of [23], [36], and [37], which is characterized in that the above-mentioned base sequence information contains at least three bases or more.
  • the predetermined number of bases is 13 to 28, and is any one of [23], [36], [37], and [38].
  • the partial base sequence creating step is characterized in that it further includes an overhang site-containing base sequence creating step of creating the partial base sequence information including the overhang site.
  • the program according to any one of [36], [37], [38], and [39].
  • an overhang site adding step of adding the overhang site to at least one end of the specified sequence information wherein [23], [36], [37], [3] 8] The program according to any one of [39].
  • the same-similar base sequence searching step of searching the same base sequence information identical or similar to the specified sequence information from the other base sequence information, and the above-mentioned same base sequence searched in the same similar base sequence searching step An unrelated gene target evaluation step of evaluating whether or not the specified sequence information has the ability to target a gene unrelated to the Kami-Soshi target gene based on the same or similar base sequence information.
  • the irrelevant gene target evaluation step includes the base sequence information of the gene irrelevant to the target gene among the same or similar base sequence information searched in the same or similar base sequence search step. And calculating the sum of the reciprocals of the values indicating the degree of the similarity based on the value indicating the degree of the similarity attached to the base sequence information of the gene irrelevant to the target gene.
  • a summation standard target evaluation step for evaluating whether or not the specified sequence information has the ability to target the gene irrelevant to the target gene, based on the calculation step and the sum calculated in the summation calculation step
  • the partial base sequence creating means comprises: The base sequence processing system according to [25], further comprising a region designation base sequence creating means for creating partial base sequence information. .
  • the partial base sequence creating means is common to a plurality of pieces of base sequence information derived from different organisms, and the partial base sequence information of the predetermined number of bases is common.
  • the rich base sequence information is the base sequence information consisting of the seven bases, the adenine, the thymine, and one selected from the group consisting of peracyl or The base according to any one of [25], [46], and [47], wherein the base sequence information includes at least two or more bases at least three bases or more.
  • Array processing system is the base sequence information consisting of the seven bases, the adenine, the thymine, and one selected from the group consisting of peracyl or The base according to any one of [25], [46], and [47], wherein the base sequence information includes at least two or more bases at least three bases or more.
  • the predetermined number of bases is 13 to 28, wherein [25], [46], [47], [48] Nozomi
  • the base sequence processing system according to any one of the above.
  • the partial base sequence creating means further includes an overhang site-containing base sequence creating means for creating the partial base sequence information including an overhang site.
  • the base sequence processing system according to any one of [25], [46], [47J, [48], and [49].
  • the base sequence processing apparatus further comprises an overhang site adding means for adding the overhang site to at least one end of the specified sequence information [25], [46] , [47], [48], [49].
  • the base sequence processing apparatus further comprises: an identical or similar base sequence searching means for searching the same or similar base sequence information as the specified sequence information from the other base sequence information; and An unrelated gene target evaluation means for evaluating whether or not the specified sequence information targets a gene unrelated to the target gene, based on the same or similar base sequence information searched in (25), (46), (47), (48), (49), (50), (51), (52)
  • the base sequence processing system according to any one of the above.
  • the irrelevant gene target evaluation means is irrelevant to the target gene in the same or similar base sequence information searched by the same or similar base sequence search means.
  • a value indicating the degree of the same similarity based on the total number of the base sequence information of the gene described above and the value indicating the degree of the similarity assigned to the base sequence information of the gene irrelevant to the target gene Sum calculation means for calculating the sum of the reciprocals of the above, and, based on the sum calculated by the sum calculation means, whether or not the specified sequence information targets the gene irrelevant to the target gene.
  • the base sequence processing system according to [53] further comprising: a total reference target evaluation means for evaluating the target.
  • FIG. 1 is a diagram showing the design of a siRNA that is a common sequence between human and mouse
  • FIG. 2 is a diagram showing the regularity of the siRNA showing the RNAi effect
  • FIG. FIG. 4 is a diagram showing a common site (a bold part) having a defined sequence in the nucleotide sequences of FBP1 and mouse Fbpl.
  • FIG. 4 is a diagram listing the defined sequences common to human FBP1 and mouse Fbp1.
  • Yes Fig. 5 is a diagram in which the predetermined sequences common to human FBP1 and mouse Fbp1 are scored
  • Fig. 6 shows one of the predetermined sequences so as not to knock out genes other than the target.
  • FIG. 1 is a diagram showing the design of a siRNA that is a common sequence between human and mouse
  • FIG. 2 is a diagram showing the regularity of the siRNA showing the RNAi effect
  • FIG. 4 is a diagram showing a common site (a bold part) having a defined
  • FIG. 7 is a diagram showing the result of a BLAST search of one of the predetermined sequences to prevent knockout of genes other than the target.
  • FIG. 8 is a diagram showing the result of Fig. 9 shows the design results (a to p) of the RNA fragment.
  • FIG. 10 shows the results of a force test of siRNAs a to p showing the RNAi effect, where “B” shows the results in cultured Drosophila cells and “C” shows the results in humans. It is a figure which shows the result in a cultured cell, FIG. ) Is a diagram showing the results of analyzing the characteristics of the sequence of the siRNA,
  • FIG. 12 is a principle configuration diagram showing the basic principle of the present invention, and FIG.
  • FIG. 13 is a diagram showing the present system to which the present invention is applied.
  • FIG. 14 is a block diagram showing an example of the configuration of the base sequence processing device 100 of FIG. 14,
  • FIG. 14 is a diagram showing an example of information stored in the target gene base sequence file 106a,
  • FIG. 16 is a diagram illustrating an example of information stored in a partial base sequence file 106b,
  • FIG. 16 is a diagram illustrating an example of information stored in a determination result file 106c,
  • FIG. FIG. 18 is a diagram illustrating an example of information stored in a sequence file 106d.
  • FIG. 18 is a diagram illustrating an example of information stored in a reference sequence database 106e.
  • FIG. 19 is a diagram illustrating an example of an identical similarity file.
  • FIG. 20 is a diagram showing an example of information stored in 106f.
  • Fig. 20 shows an evaluation result file.
  • FIG. 21 is a diagram showing an example of information stored in 106 g.
  • FIG. 21 is a block diagram showing an example of the configuration of a partial base sequence creation unit 102a of the present system to which the present invention is applied.
  • the figure is a block diagram showing an example of the configuration of the unrelated gene target evaluation unit 102h of the present system to which the present invention is applied.
  • FIG. 23 is a flow chart showing an example of the main processing of the present system in the present embodiment
  • FIG. 24 is an example of the irrelevant gene target evaluation processing of the present system in the present embodiment.
  • FIG. 25 is a diagram showing the structure of target expressed ⁇ pTREC, and FIG.
  • FIG. 26 is a diagram in Example 2 (2).
  • FIG. 27 shows the results of PCR in the case where one of the primers was not designed with an intron
  • FIG. 27 is a diagram showing one of the primers in Example 2, 2. (2) with an intron. It is a figure which shows the result of PCR when it is designed.
  • FIG. 28 is a figure which shows the sequence and structure of siRNA; siVIM35,
  • FIG. 29 is the sequence and structure of siRA; siVIM812.
  • FIG. 30 is a diagram showing the sequence and structure of siRNA; siControl;
  • FIG. 1 shows the results of assaying the RNAi activity of siVIM812 and siVIM35.
  • FIG. 32 is a diagram showing the RNAi activity of siControl, siVIM812 and siVIM35 on vimentin
  • FIG. 33 is a diagram showing the results of antibody staining
  • FIG. 34 is a diagram showing si designed by the program.
  • FIG. 35 shows the measurement results of RNAi activity on RNA luciferase gene
  • FIG. 35 shows the measurement results of RNAi activity on the sequence of the SARS virus of siRNA designed by the program. It is a figure
  • Embodiments of the present invention will be described in the following order from ⁇ 1> to ⁇ 7>.
  • the search method of the present invention is a method for searching a base sequence of a target gene for a base sequence that causes RNA interference. Specifically, in the search method of the present invention, a sequence site according to the following rules (a) to (d) is searched from the base sequence of the target gene for RNA interference.
  • the terminal base is adenine, thymine or peracyl.
  • the terminal base is guanine or cytosine.
  • the number of bases is a number that can cause RNA interference without causing cytotoxicity.
  • Gene in “target gene” refers to a medium that encodes genetic information.
  • a “gene” is composed of a substance that encodes genetic information, such as a complex of DNA, RNA, DNA and RNA, but the genetic information is not a substance itself but a computerized electronic form of the base sequence. Etc.
  • the “target gene” may be a single coding region, may be a target over a plurality of code regions, or may be any polynucleotide whose sequence is known.
  • RNA interference is known as a phenomenon that disrupts mRNA by interference, and the search load can be reduced by selecting a specific coding region.
  • a group of transcription regions may be searched as a target gene.
  • the nucleotide sequence is shown based on the sense chain, that is, the mRNA sequence, unless otherwise specified.
  • a nucleotide sequence that satisfies the above rules (a) to (d) is referred to as a “prescribed sequence”.
  • thymine corresponds to the nucleotide sequence of DNA
  • peracyl corresponds to the sequence of RNA.
  • Rule (c) stipulates that the sequence near the end 3 contains a rich base selected from the group consisting of adenine, thymine, and racil. As an index for searching, it specifies that a base selected from adenine, thymine and racyl is a rich sequence within 7 bases from the 3 ′ end.
  • “rich sequence” means that a specific base frequently appears, and when the ratio is schematically shown, 5 to 10 bases at the 3 ′ terminal side of the specified sequence, Preferably, it means that at least 40% or more, more preferably 50% or more, of one or more selected from the group consisting of adenine, thymine and uracil is contained in the sequence of 7 bases. More specifically, for example, in the case of a regular sequence of about 19 bases, for example, of the 7 bases on the 3 ′ end side, preferably at least 3 bases or more, more preferably 4 bases or more, particularly preferably 5 bases or more The base or more is one or two or more selected from the group consisting of adenine and thymine hoplacil.
  • Adenine and thymine or peracyl form complementary hydrogen bonds in double-stranded polynucleotides.
  • three hydrogen bonding sites are formed in the complementary hydrogen bond (G—C hydrogen bond) between guanine and cytosine, while the complementary hydrogen bond (A_ ( T / U) Hydrogen ) Consists of two hydrogen bonding sites.
  • A- (T / U) hydrogen bond has weaker bonding force than G-C hydrogen bond.
  • Rule (d) specifies the number of bases in the base sequence to be searched.
  • the number of bases in the base sequence to be searched is the number of bases that can cause RNA interference. Also, it is known that, depending on the conditions such as the species of the organism, sRNA having too large a number of bases may cause cytotoxicity.
  • the upper limit of the number of bases varies depending on the type of organism that causes RNA interference, it is preferable that the number of bases of a single strand constituting siRNA is 30 or less in any case.
  • the number of bases in mammals is preferably 24 or less, more preferably 22 or less.
  • the lower limit is not particularly limited as long as it causes RNA interference, but is preferably 15 or more, more preferably 18 or more, and still more preferably 20 or more.
  • the number of bases as a single strand constituting siRNA is particularly preferably searched for in '21.
  • the siRNA has an overhang at the 3 'end of the specified sequence. It is preferable that the overhang portion has 2 bases. Therefore, the upper limit of the number of bases of only the prescribed sequence without including the overhang portion is preferably 28 or less, more preferably 22 or less, and still more preferably 20 or less, and the lower limit is preferably 13 or more, It is preferably 16 or more, more preferably 18 or more.
  • the most preferred number of bases in the defined sequence is 19.
  • the search for the target nucleotide sequence of AN Ai may be performed with or without the overhang portion.
  • a base sequence that conforms to the prescribed sequence has an extremely high probability of causing RNA interference. Therefore, by the search method of the present invention, it is possible to search for a sequence that causes RNA interference with extremely high accuracy, and it is possible to simplify the design of a polynucleotide that causes RNA interference. .
  • the defined sequence is a sequence that does not include a sequence of 7 or more guanines (G) and Z or cytosine (C).
  • Consecutive guanine and Z or cytosine of 7 bases or more means, for example, that only one of guanine or cytosine is continuous and that guanine and cytosine are consecutive.
  • the specified sequence can be efficiently detected using a computer equipped with a program that searches for a part that conforms to the rules (a) to (c) above after defining the number of bases. . More specific embodiments are shown below in the columns of 5> s RNA sequence design program, and 7> s RNA sequence design program that executes a sRNA sequence design program.
  • RNA interference S i RNA
  • siRNAs are mainly composed of RNA, but also include hybrid polynucleotides partially containing DNA.
  • a base sequence according to the above-mentioned rules (a) to (d) is searched from the base sequence of the target gene, and a base sequence homologous to the searched base sequence is designed.
  • the specified sequence is a sequence that does not contain a continuous sequence of 7 or more bases of guanine (G) and Z or cytosine (C).
  • G guanine
  • C cytosine
  • homology refers to a sequence containing mutations such as deletion, substitution, and insertion of the same sequence and the same sequence as long as the function of causing the RNA interference is not lost. Although it depends on the conditions such as the type and sequence of the target gene, if the allowed mutation is exemplified by homology (homozygosity), it is preferably 80% or more, more preferably 90% or more, and still more preferably 95% or more. % Or more. When calculating the degree of homology as an acceptable degree of mutation, it is desirable to compare numerical values calculated using the same search algorithm.
  • the search algorithm is not particularly limited, but a search algorithm suitable for local sequence search is suitable. More specifically, BLAST, ssearch, and the like can be suitably used.
  • the searched sequence may be slightly modified, but it is particularly preferable that the designed base sequence has the same number of bases as the searched sequence.
  • the bases of the designed base sequence are preferably searched for at least 80%, more preferably at least 90%, particularly preferably at least 95%.
  • the bases at the 3 and end of the searched base sequence are the same as the bases at the 3 and end of the designed base sequence. It is desirable that the base at the 5th end of the searched base sequence is the same as the base at the 5th end of the designed base sequence.
  • the siRNA molecule is provided with an overhang portion.
  • the overhang portion is a portion of a double-stranded siRNA molecule, which is provided at the 3, terminal of each chain and protrudes in a single-stranded state.
  • the number of bases in the overhang portion is particularly preferably 2, although it depends on the type of organism.
  • the base sequence of the overhang portion is basically arbitrary, but the same base sequence, TT, or UU as the target gene of the search source may be suitably used.
  • a search can be performed from the beginning, including the specified sequence and the overhang, to design.
  • the preferred number of bases in the overhang portion is 2. Therefore, for example, when designing a single strand that constitutes a si RNA consisting of a defined sequence having 19 bases and an overhang portion having 2 bases, si.R NA including the overhang portion is required.
  • a sequence having 21 bases may be searched for from the target gene, and when searching for a double-stranded state, a sequence having 23 bases may be searched for.
  • a predetermined sequence is searched for from a desired target gene as described above, but the target for causing RNA interference is determined based on the target gene.
  • a gene isolated from a first species can be used as a target gene, and a siRNA to be used for a second species that is a related species of the first species can be designed.
  • a siRNA to be used for a second species that is a related species of the first species can be designed.
  • searching for a common sequence from a plurality of types of mammals and searching for and designing the above defined sequence from this common sequence it is possible to design siRNAs that can be widely applied to mammals. This is because sequences that are common to multiple mammals are likely to be conserved in other mammals.
  • RNA interference even for genes that are not related to the target gene, it is preferable to search for sequences that are identical or similar to the designed sequence in other genes! / ,.
  • the search for a sequence identical or similar to the designed sequence may be performed using software or the like capable of performing a general homology search. By excluding such identical z-similar sequences, it is possible to design a sequence that specifically causes RNA interference in only the target gene.
  • an RNA molecule that causes RNA interference can be easily designed with high probability.
  • the synthesis of RNA still requires labor, time and cost, but the design method of the present invention can greatly reduce them.
  • the method for producing a double-stranded polynucleotide of the present invention is a method for producing a high-level double-stranded polynucleotide having a high probability of causing RNA interference.
  • the nucleotide sequence of the polynucleotide is designed according to the above-described nucleotide sequence designing method of the present invention, and the double-stranded polynucleotide is synthesized according to the sequence design.
  • sequence design is the same as the description of the base sequence design method.
  • the double-stranded polynucleotide is for synthesizing a double-stranded polynucleotide that causes RNA interference, and siRNA is known as such a double-stranded polynucleotide.
  • the double-stranded polynucleotide produced by the production method of the present invention is preferably composed of RNA, but may be a hybrid polynucleotide partially containing DNA. In the present specification, those containing DNA in part 200
  • siRNAs tend to have structurally asymmetry (asymmetry) in terms of function, and from the viewpoint of causing RNA interference, the 5,5 It is desirable that the terminal half, 3 and the terminal half of the antisense strand be composed of RNA.
  • Double-stranded polynucleotide one strand is included in the base sequence of the target gene
  • (a) a sequence complementary to the base sequence homologous to the specified sequence, which is formed by providing an overhang at the 3rd end of the base sequence homologous to the specified sequence according to the rules of (c). 3. Formed with an overhang at the end.
  • the number of bases in each chain is 18 to 24, including the single bar hang, more preferably 20 to 22, and particularly preferably 21. Further, the number of bases in the overhanging portion is preferably 2.
  • An sRNA having a total number of bases of 21, of which the overhang portion is composed of bases of 2 is suitable as sRNA which causes RNA interference with high probability even in mammals without causing cytotoxicity.
  • RNA may be synthesized by, for example, chemical synthesis, or may be performed in accordance with ordinary techniques such as biotechnology.
  • a DNA chain having a predetermined sequence is prepared and transcribed as type III.
  • a single-stranded RNA can be synthesized using an enzyme, and the single-stranded RNA can be converted into a double-stranded RNA, for example.
  • the preferred form of the polynucleotide obtained by the above-mentioned production method of the present invention is as follows: In the base sequence of the target gene for RNA interference, a sequence site having 13 to 28 bases is determined according to the rules (a) to (d) above. And one of the strands has the base sequence of the target gene.
  • a double-stranded polynucleotide which is formed by providing an overhang at the end of the base sequence complementary to the base sequence and is synthesized so that the number of bases in each chain is 15 to 30 .
  • the polynucleotide is a polynucleotide having a high probability of causing RNA interference.
  • an expression vector that expresses siRNA can be prepared. By placing a vector that expresses a sequence containing a regulatory sequence under conditions of a cell-free system or a cell system in which expression can be performed, a predetermined siRNA can be supplied using an expression vector. .
  • RNA interference a double-stranded polynucleotide causing RNA interference can be produced with a high probability.
  • search method, sequence design method or polynucleotide production method of the present invention described above it is possible to greatly reduce the labor, time, and cost required for various tests and production utilizing RNA interference. That is, the present invention significantly enhances various tests, research, development, production, etc. that utilize RNA interference, such as gene analysis, drug discovery target search, drug discovery, gene therapy, and study of differences between species. It can be simplified and the efficiency can be improved.
  • the method for suppressing gene expression of the present invention comprises the steps of: searching for a predetermined nucleotide sequence; designing and synthesizing a nucleotide sequence of siRNA based on the searched nucleotide sequence; And introducing it into an expression system.
  • the step of searching for a predetermined base sequence follows the above-described method for searching for a target base sequence for RNA interference. Preferred embodiments are also as described above.
  • the step of designing and synthesizing the base sequence of siRNA based on the searched base sequence includes the above-described method of designing a base sequence of a polynucleotide that causes RNA interference, and a method of preparing a double-stranded polynucleotide. The preferred embodiment is also the same.
  • the resulting double-stranded polynucleotide is added to a target gene expression system to suppress the expression of the target gene.
  • the current system of the target gene is a system in which the target gene is expressed, and more specifically, a system having a reaction system in which at least the mRNA of the target gene is formed.
  • the target gene expression system includes both In Vitro and Invivo.
  • As a target gene expression system in addition to cultured cells, cultured tissues, living organisms, etc., it can also be used in a cell-free system.
  • the target gene whose expression is to be suppressed is not necessarily limited to the species that matches the origin of the searched sequence, but may be closely related to the origin of the target gene and the target gene. The more, the more specific and effective the suppression of a specific gene.
  • a specific example is an expression vector having a nucleotide sequence consisting of a defined sequence and an overhang portion, which is obtained by transfecting a double-stranded polynucleotide into a cultured cell having a target gene and incorporating the polynucleotide into the cell. And introducing it into cells having the target gene.
  • a polynucleotide capable of efficiently causing RNA interference can be obtained, and thus the gene can be suppressed efficiently and easily.
  • This program is based on the sequence information of human and mouse homologues that have already been published when performing RNA interference with species whose genome sequence has not progressed, such as horses and pigs. It calculates the sequence of the siRNA that can be used in the target species. By designing si RNAs with this program, RNA negotiations can be performed quickly without sequencing the target gene. In the design (calculation) of siRNA, a sequence having a high probability of having RNAi activity is selected in consideration of the rules of G or C allocation (the rules shown in (a) to (d) above), and What is a target gene? A check is performed by homology search to prevent RNA interference with unrelated genes.
  • G or C may be described as “GZC”
  • a or T may be described as “ ⁇ ”.
  • ⁇ / U (U) indicates ⁇ (thymine) in the case of a sequence derived from deoxyribonucleic acid, and indicates U ( ⁇ racil) in the case of a sequence derived from ribonucleic acid.
  • siRNA can target both human and mouse gene X (Fig. 1). Since the completely common part between human and mouse is considered to be highly likely to be conserved in other mammals, the above siRNAs are not only human and mouse gene X, but also other mammals It is also expected to function for gene X. In other words, even if the sequence of the target gene is unknown, the siRNA can be designed using this program if the sequence information is known for the corresponding human and mouse homologs.
  • FIG. 2 is a diagram showing the regularity of the sequence of siRNA, which indicates the RNAi effect (rule of GZC allocation of siRNA).
  • Fig. 2 two RNA strands with a length of 21 bases form base pairs between the 19 bases on the 5 'side so that each has an overhang of 2 bases on the 3' side.
  • the coding side sequence of the 19 bases forming base pairs is: 1) 3, the end is AZU, 2) 5, the end is G / C, 3)
  • the 7 characters on the 3 'side are required to have a high ratio of AZ U.
  • conditions 1) and 2) are important
  • (5-3) Program structure This program consists of three parts. (5-3-1) a part for searching for a sequence (subsequence) of a common site between human and mouse; (5-3-2) a part for scoring the sequence based on the rules of GZC distribution; (5-3-3) This is the part that is checked by homology search so as not to target unrelated genes.
  • Score 23 character sequences to select only those sequences that meet the G / C allocation rules described above.
  • a 23 character array is scored as follows:
  • Score 3 Of the seven characters from the 15th to the 21st character from the beginning, Number of AZU. [0-7]
  • FIG. 5 shows the results of calculations performed on the 15 sequences shown in FIG.
  • FIG. 5 is a diagram in which sequences common to human FBP 1 and mouse Fb pl are scored. . After the sequence shown in Fig. 5, score 1, score 2, score 3, and the total score are described in order.
  • the homology score (X) is obtained by the following equation.
  • FIG. 6 shows the result of BLAST of “caccctgacccgcttcgtcat gg”, which is common to human FBP1 and mouse Fbp1, and the first two lines are mouse Fbpl and human Fbppl.
  • BP 1 is the hit.
  • Homologous' score is 5.9 with few hits This is a good example.
  • SiRNAs of this sequence have a low risk of targeting other genes.
  • FIG. 7 shows the result of BLAST of the sequence “gccttctgagaaggatgctct g cj” which is common to human FBP 1 and mouse Fb 1. In the example with many hits, the homology score is 170. Not suitable as siRNA because of the high risk of targeting other genes.
  • the above (5-3-1), (5-3-2) and (5-3-3) parts may be configured as one body, and the human and mouse rooster shown in Fig. 3 If you input your own sequence, you will get the output directly as shown in Fig. 8.
  • the score 1, the score 2, the score 3, the total score, and the value obtained by multiplying the homology score by 10 are described in order.
  • a sequence having an overall score of 0 may not calculate the homology score. From this result, it can be seen that it is only necessary to use “36 caccctgacccgcttcgtcat g'gj sound ! minute” as s i RNA.
  • (5 ⁇ 3 ⁇ 1), (5 ⁇ 3 ⁇ 2), (5-3 One of the functions in 3) can be used independently.
  • siRNA was actually designed by this program for about 6400 gene pairs among the homologs between human and mouse. As a result, for about 70%, with a common sequence to the human and mouse, meet Chikaratsu valid s i RN A sequence regularity of rules, si RNA that does not target the unrelated gene could be designed .
  • siRNAs are expected to have the effect of effectively suppressing target genes not only in humans and mice but also in a wide variety of mammals, and are considered to have high industrial value, such as application to domestic animals and pet animals. It is also possible to use this program to design siRNAs that sometimes target multiple genes within the same species, for example, eIF2C1 and eIF2C2. The method is very powerful with a wide range of applications. Furthermore, there is also a use in which a PCR primer can be designed using a sequence of a common portion between human and mouse to amplify a target gene in various mammals. An embodiment of an apparatus for executing the siRNA sequence design program is described in detail in the column of ⁇ 7> Nucleotide sequence processing apparatus for executing the siRNA sequence design program below.
  • the siRNA sequence design business model system of the present invention refers to a genome database, an EST database, and an evolved phylogenetic tree database alone or in combination with each other along with the logic of the program.
  • this system proposes effective siRNA to customers according to the aVai1ab1e status of gene sequence information.
  • the aVai1ab1e state means that information is available.
  • genomic information is not a V ai 1 a 1 e
  • the genetic information of the species belonging to a relationship that preserves the same gene function (same genus or same origin)
  • Gene sequences of two or more species whose genomic sequence is a V ai 1 ab 1 e sandwiched between a child sequence or an evolutionary phylogenetic tree are used to extract effective siRNA candidates. Display the sequence and its evaluation result.
  • Gene function analysis of infectious diseases and discovery of drug targets include the genome database of microorganisms and the comprehensive phylogenetic tree database, which is combined with information on apoptosis induction sites and function expression sites of microorganisms to provide comprehensive siRNA candidate sequences. The method required is effective.
  • Nucleotide sequence processor that executes the siRNA RNA design program
  • a base sequence processing apparatus a program for causing a computer to execute a base sequence processing method, a recording medium, and a base sequence processing system according to the present invention, which are apparatuses for executing the above-described siRNA sequence design program
  • the form will be described in detail with reference to the drawings.
  • the present invention is not limited by the embodiment. . '
  • FIG. 12 is a principle configuration diagram showing the basic principle of the present invention.
  • the present invention generally has the following basic features. That is, the present invention obtains the base sequence information of the target gene for RNA interference, and creates partial base sequence information that is a sequence site having a predetermined number of bases in the base sequence information (step S-1).
  • step S-1 partial base sequence information of a predetermined number of bases may be created from a site corresponding to the coding region or transcription region of the target gene in the base sequence information.
  • partial base sequence information of a predetermined number of bases common to a plurality of base sequence information derived from different organisms for example, human base sequence information and mouse base sequence information
  • common partial base sequence information having a predetermined number of bases common to a plurality of similar base sequence information in the same organism species may be created.
  • common partial base sequence information having a predetermined number of bases may be created from a region corresponding to a target gene coding region or a transcription region of a plurality of base sequence information derived from different organisms.
  • common partial base sequence information having a predetermined number of bases may be created from a region corresponding to a target gene coding region or a transcription region of a plurality of similar base sequence information in the same species. ,.
  • a defined sequence that specifically causes RNA interference with the target gene can be efficiently selected, and the calculation load can be reduced.
  • step S-1 partial nucleotide sequence information including an overhang site may be created.
  • partial base sequence information to which overhang site containing information indicating that an overhang site is included may be created. That is, the partial base sequence information and the overhang site content information are exchanged. May be associated. As a result, it becomes possible to select from the beginning, including the defined sequence and the overhang site, and to design.
  • the upper limit of the predetermined number of bases is preferably 28 or less, more preferably 22 or less, and still more preferably 20 or less when the overhang site is not included. Is preferably 32 or less, more preferably 26 or less, and still more preferably 24 or less.
  • the predetermined lower limit of the number of bases is preferably 13 or more, more preferably 16 or more, and still more preferably 18 or more when not including an overhang site, and when including an overhang site, It is preferably 17 or more, more preferably 20 or more, and further preferably 22 or more.
  • the most preferable predetermined number of bases is 19 when an overhang site is not included, and is 23 when an overhang site is included. As a result, it is possible to efficiently select a regulatory sequence that causes RNA interference without causing cytotoxicity even in a suckling mammal.
  • step S-2 it is determined whether or not the 3 ′ terminal base of the partial base sequence information created in step S-1 is adenine, thymine, ′, or peracyl (step S-2). Note that, specifically, for example, “3” may be output as the determination result when the terminal base is adenine, thymine, or peracyl, and otherwise “0”.
  • step S-3 it is determined whether or not the terminal at the terminal 5 of the partial base sequence information created in step S-1 is guanine or cytosine (step S-3).
  • “5” may be output as a determination result if the terminal base is guanine or cytosine, and “0” otherwise.
  • the base sequence information consisting of the 3 and 7 terminal bases of the partial base sequence information created in step S-1 is one or more bases selected from the group consisting of adenine, thymine, and peracyl It is determined whether or not is rich nucleotide sequence information (step S_4).
  • step S-4 the base sequence information near the 3 'end of the partial base sequence information created in step S-1 is selected from the group consisting of adenine, thymine, potato, and peracyl.
  • Species or two or more bases are specified as rich base sequence information.
  • index for performing a search base sequence information within a range of 3, 7 bases from the terminal is added, It stipulates that one or more bases selected from the group consisting of thymine and peracil are rich base sequence information.
  • the “rich nucleotide sequence information” is the “rich sequence” described in 1) the method for searching for a target nucleotide sequence of RNA interference as described above, and specifically, For example, if the partial base sequence information created in step S-1 is composed of about 19 bases, the base sequence information consisting of 7 bases of the partial base sequence information is obtained from the group consisting of Adene, thymine, and Peracinole.
  • the nucleotide sequence information contains at least one or more selected bases, preferably at least three bases, more preferably at least four bases, particularly preferably at least five bases.
  • a sequence site excluding the overhang site in the partial base sequence information is determined as a determination target.
  • step S-5 RNA specific to the target gene is extracted from the partial base sequence information created in step S-1. Select the sequence information that causes interference (step S-5).
  • step S-2 the base at the 3 ′ end is determined to be adenine, thymine, or peracyl
  • the base at the 5 ′ end is guanine or cytosine
  • the base sequence information consisting of 7 bases at the 3 ′ end of the partial base sequence information in step S- 4 is one or more selected from the group consisting of adenine, thymine, and peracyl
  • the partial base sequence information in which two or more bases are determined to be rich base sequence information is selected as the specified sequence information.
  • step S-2 the product of the numerical values output in step S-4 is calculated, and based on the value of the product, the specified sequence information may be selected from the partial base sequence information created in step S-1. .
  • the probability of causing RNA interference is extremely high, that is, an siRNA sequence effective for RNA interference can be efficiently and easily created.
  • an overhang site may be added to at least one end of the specified sequence information selected in step S-5.
  • overhang sites may be added to both ends of the specified sequence information. This can simplify the design of a polynucleotide that causes RNA interference.
  • the number of bases in the above-mentioned overhang site is the number of bases described in the above ⁇ 2> the method of designing a base sequence of a polynucleotide causing RNA interference, and specifically, for example, 2 is used. Particularly preferred.
  • base sequence information identical or similar to the specified sequence information selected in step S-5 is transmitted to another base sequence information (for example, NCB I's RefSeq (Reference Sequence project)).
  • Base sequence information published in public databases), using, for example, existing homology search methods such as BLAST, FASTA, and ssearch. Based on the same or similar base sequence information found, the specified sequence The information may be evaluated for its ability to target genes unrelated to the target gene.
  • base sequence information identical or similar to the specified sequence information selected in step S-5 is converted to other base sequence information (for example, using a public database such as NCB I's RefSeq).
  • base sequence information for example, using a public database such as NCB I's RefSeq.
  • Publicly available base sequence information or, for example, by searching using an existing homology search method such as BLAST, FASTA, or ssearch, and searching for the same or similar base sequence information, genes that are unrelated to the target gene
  • the value indicating the degree of similarity and similarity attached to the nucleotide sequence information of genes unrelated to the target gene for example, “Eva 1 ue” for BLAST, FASTA and ssearch).
  • the sum of the reciprocals of the value indicating 34 is calculated, and based on the calculated sum (for example, based on the size of the calculated sum), the target sequence information targets a gene irrelevant to the target gene. You can evaluate your strength or not.
  • a sequence that specifically causes RNA interference can be selected from only the target gene from the specified sequence information.
  • RNA is synthesized based on the specified sequence information that does not cause RNA interference even for genes not related to the target gene selected according to the present invention, the labor, time, and cost involved Can be greatly reduced.
  • FIG. 13 is a block diagram showing an example of the configuration of the present system to which the present invention is applied, and conceptually shows only those parts of the configuration relating to the present invention.
  • This system roughly provides a base sequence processing device 100 for processing base sequence information of a target gene for RNA interference, an external database for sequence information and structural information, and an external program such as homology search.
  • An external system 200 is communicably connected via a network 300.
  • a network 300 has a function of interconnecting the base sequence processing apparatus 100 and an external system 200.
  • the system 2000 is mutually connected to the base sequence processor 100 via a network 300, and provides an external database of sequence information and structural information to users for homology search, motif search, etc. It has a function to provide a website that executes an external program.
  • the external system 200 may be configured as a WEB server, an ASP server, or the like, and its hardware configuration is generally a commercially available workstation, an information processing device such as a personal computer, and its accompanying devices. It may be constituted by.
  • each function of the external system 200 It is realized by a CPU, a disk device, a memory device, an input device, an output device, a communication control device and the like in the configuration and a program for controlling them.
  • the base sequence processing device 100 is generally a control unit 102 such as a CPU that comprehensively controls the entire base sequence processing device 100, and a router connected to a communication line or the like.
  • a communication control interface 104 connected to a communication device (not shown), an input / output control interface 108 connected to an input device 112 and an output device 114, and It is configured to include a storage unit 106 for storing various databases, tapes, and the like, and these units are communicably connected via an arbitrary communication path.
  • the base sequence processing apparatus 100 is communicably connected to a network 300 via a communication device such as a router and a wired or wireless communication line such as a dedicated line.
  • target gene base sequence file 106a to target gene annotation database 106h are storage means such as a fixed disk device. Stores various programs used for various processes, such as files and files, files for database base pages, and the like. Among these constituent elements of the storage unit 106, the target gene base sequence file 106a is a target gene base sequence storage means for storing base sequence information of the target gene of RNA interference.
  • FIG. 14 is a diagram showing an example of information stored in a target gene base sequence file 106a.
  • the information stored in the target gene base sequence file 106a is base sequence identification information (eg, No. 14) that uniquely identifies the base sequence information of the target gene for RNA interference. It is configured by associating “NM-0000507” in the figure) with nucleotide sequence information (for example, “AT GGCT GA ′ ⁇ AGT GA” in FIG. 14).
  • the partial base sequence final 106b is a partial base sequence storage means for storing partial base sequence information which is a sequence site having a predetermined number of bases in base sequence information of a target gene of RNA interference.
  • FIG. 15 is a diagram showing an example of information stored in a partial nucleotide sequence file 1 ⁇ 6b.
  • the information stored in the partial nucleotide sequence file 106b is, as shown in FIG. 15, partial nucleotide sequence identification information that uniquely identifies the partial nucleotide sequence information (for example, “NM—000507- 36 ”;)”, partial nucleotide sequence information (for example, “caccct '.' Tcatgg” in FIG. 15), and overhang site-containing information indicating that an overhang site is included (for example, It is composed of “contents” in Fig. 15 linked to each other.
  • the determination result file 106c stores the results determined by 3, the terminal base determination unit 102b, 5, the terminal base determination unit 102c, and the specific base content determination unit 102d described later. This is the determination result means.
  • FIG. 16 is a diagram showing an example of information stored in the determination result file 106c.
  • the information stored in the determination result file 106 c includes partial base sequence identification information (for example, “NM_000507: 36” in FIG. 16), and 3, the terminal base determination unit 102. b, 3, the terminal base determination result (for example, “1” in FIG. 16), and 5, the terminal base determination unit 102c, the result determined by 102c.
  • the base determination result for example, “1” in FIG. 16
  • the specific base content determination result for example, “4” in FIG. 16
  • the 3, terminal base determination result and the 5, terminal base determination result are determined to be “included” by the 3, terminal base determination section 102b and the 5 ′ terminal base determination section 102c, respectively.
  • the specific base content determination result is selected from the group consisting of adenine, thymine, and peracil contained in the base sequence information consisting of the three bases and the three terminal 7 bases of the partial base sequence information. This is an example when the number of species or two or more types of bases is set. Further, in FIG.
  • the comprehensive judgment results are 3, terminal base judgment result, 5, terminal base judgment result, and specific base This is an example of a case where a product of presence / absence determination results is set. Note that, specifically, for example, when the product is 3 or less, “0” may be set.
  • the defined sequence file 106d is defined sequence storage means for storing defined sequence information, which is partial base sequence information that causes RNA interference specifically in a target gene.
  • FIG. 17 is a diagram showing an example of information stored in the prescribed sequence file 106d.
  • the information stored in the specified sequence file 106d includes partial base sequence identification information (for example, "NM-000507: 36" in Fig. 17) and RNA specific to the target gene. It is configured by associating prescribed sequence information (for example, “caccct” and “tcatgg” in FIG. 17) which is information on a partial base sequence causing interference.
  • the reference sequence database 106e stores reference base sequence information, which is base sequence information referred to in order to search for base sequence information identical or similar to the prescribed sequence information in the same similar base sequence search unit 102g described below.
  • the reference sequence database 106e may be an external base sequence information database accessed via the Internet, and may copy these databases, store original rooster sequence information, Further, it may be an in-house database created by adding original annotation information or the like.
  • FIG. 18 is a diagram showing an example of information stored in the reference sequence database 106e.
  • the information stored in the reference sequence database 106-e includes reference sequence identification information (for example, “ref I NM_015820. 1
  • the same similarity file 106 f stores the same similarity, which is a value indicating the degree of the same similarity attached to the same or similar base sequence information searched for by the same similar base sequence searching unit 102g described later. This is the same similarity storage means to be stored.
  • FIG. 19 is a diagram showing an example of information stored in the same similarity file 106f.
  • the information stored in the similarity similarity 106 f includes partial base sequence identification information (for example, “NM—000507: 36” in FIG. 19) and reference sequence identification information (for example, , Ref I NM— 015820.1 ⁇ and “re ⁇ I NM- 003837. l
  • the evaluation result file 106g is an evaluation result storage unit that stores the result of evaluating whether or not a gene unrelated to the target gene is targeted by the unrelated gene target evaluation unit 102h described below.
  • FIG. 20 is a diagram showing an example of information stored in the evaluation result file 106g.
  • the information stored in the evaluation result file 106 g includes partial base sequence identification information (for example, “NM—000507: 36 ⁇ and“ NM—000507: 441 ”in FIG. 20) and The sum calculated by the sum calculation unit 102 m described later (for example, “5.9” and “170.8” in FIG. 20) and the evaluation result (for example, “non-target” and “target” in FIG. 20) )))
  • the sum calculated by the sum calculation unit 102 m described later for example, “5.9” and “170.8” in FIG. 20) and the evaluation result (for example, “non-target” and “target” in FIG. 20) )
  • “non-target” means that the specified sequence information does not target a gene unrelated to the target gene
  • target means that the specified sequence information is unrelated to the target gene. To target the gene.
  • the target gene annotation database 106h is a target gene annotation storage unit that stores annotation information on a target gene.
  • the target gene annotation database 106h may be an external annotation database that stores annotation information on genes accessed via the Internet, or may be a copy of these databases. Or an in-house database created by storing original sequence information or adding unique annotation information.
  • the information stored in the target gene annotation database 106h contains the target gene identification information that identifies the target gene (for example, the gene name of the target gene, the accession number, etc. "NM 000507" and “FBP 1" at the top)) and brief information on target genes (eg For example, “Homo saiensfructose-1, 6-bisphosphatase 1” at the top of Fig. 3) is associated with each other.
  • a communication control interface unit 104 controls communication between the base sequence processing device 100 and the network 300 (or a communication device such as a router). That is, the communication control interface unit 104 has a function of communicating data with another terminal via a communication line.
  • an input / output control interface unit 108 controls the input device 112 and the output device 114.
  • a speaker can be used as the output device 114 (the output device 114 may be described as a monitor in the following).
  • the input device 112 a keyboard, a mouse, a microphone, and the like can be used.
  • the monitor also realizes the pointing device function in cooperation with the mouse.
  • the control unit 102 has a control program such as an operating system (OS), a program defining various processing procedures, and an internal memory for storing required data. Information processing for executing various processes is performed by these programs and the like.
  • OS operating system
  • Information processing for executing various processes is performed by these programs and the like.
  • the control section 102 is functionally conceptually composed of a partial base sequence creation section 102a, 3, a terminal base determination section 102b, a 5 ′ terminal base determination section 102c, a specific base content determination section 102d, a specified sequence selection section 102 e, an overhang region addition section 102f, an identical and similar base sequence search section 102g, and an unrelated gene target evaluation section 102h.
  • the partial nucleotide sequence creation unit 102a acquires the nucleotide sequence information of the target gene of RNA interference, and creates a partial nucleotide sequence information that is a sequence site having a predetermined number of nucleotides in the nucleotide sequence information. This is a means for preparing a base sequence.
  • the partial base sequence creation unit 102a includes a region designation base sequence creation unit 102i, a common base sequence creation unit 102j, and an overhang site-containing base sequence creation unit 102 k.
  • FIG. 21 is a block diagram showing an example of the configuration of the partial base sequence generator 102a of the present system to which the present invention is applied, and conceptually shows only those portions of the configuration related to the present invention. Is shown.
  • the region-designating base sequence creating unit 102 i creates partial base sequence information of a predetermined number of bases from a site corresponding to a coding region or a transcription region of a target gene in the base sequence information. Means for creating a region-specifying base sequence.
  • the common base sequence creation unit 102j is a common base sequence creation unit that creates partial base sequence information of a predetermined number of bases common to a plurality of base sequence information items derived from different organisms.
  • the overhang site-containing base sequence creation unit 102 k is an overhang site-containing base sequence creation unit that creates partial base sequence information including the overhang site.
  • the terminal base determination section 102b determines whether or not the base at the 3 'terminal of the partial base sequence information is adenine, thymine, or peracyl. It is a determining means.
  • the 5′-terminal base determining unit 102c is means for determining whether or not the base at the 5′-terminal of the partial base sequence information is guanine or cytosine.
  • the specific base content judging unit 102d is characterized in that the base sequence information consisting of 3, the terminal 7 bases of the partial base sequence information is one or more selected from the group consisting of adenine, thymine, and peracyl This is a specific base content judging means for judging whether or not the base is rich base sequence information.
  • the specified sequence selection part 102 e is determined by 3, terminal base determination part 102 b, 5, terminal base determination part 102 c and specific base content determination part 102 c. Based on the results, a defined sequence selecting means for selecting, from the partial base sequence information, defined sequence information that specifically causes RNA interference in a target gene.
  • the overhang site addition section 102 1 is an overhang site addition means for adding an overhang site to at least one end of the specified sequence information.
  • the identical / similar nucleotide sequence searching unit 102 g is an identical / similar nucleotide sequence searching means for searching nucleotide sequence information identical or similar to the specified sequence information from other nucleotide sequence information.
  • 02 h is an irrelevant gene target evaluation means for evaluating whether or not the specified sequence information targets a gene irrelevant to the target gene, based on the same or similar nucleotide sequence information.
  • the unrelated gene target evaluation section 102h further includes a sum calculation section 102m and a sum reference evaluation section 102n.
  • FIG. 22 is a block diagram showing an example of the configuration of the irrelevant gene target evaluation unit 102h of the present system to which the present invention is applied, and conceptually shows only those parts of the configuration related to the present invention. Is shown in .
  • the sum calculation unit 102 m calculates the total number of nucleotide sequence information of genes that are irrelevant to the target gene among the same or similar nucleotide sequence information, and the nucleotide sequence of the gene that is irrelevant to the target gene.
  • This is a sum calculation means for calculating the sum of the reciprocals of the values indicating the degree of the same similarity based on the value indicating the degree of the same similarity (the same degree of similarity) attached to the information.
  • the sum reference evaluation unit 102 n evaluates whether or not the specified sequence information targets a gene irrelevant to the target gene based on the sum calculated by the sum calculation unit 102 m. This is a sum-based target evaluation means.
  • FIG. 23 is a flowchart showing an example of a main process of the present system in the present embodiment.
  • the base sequence processing apparatus 100 obtains the base sequence information of the target gene for RNA interference by the partial base sequence creation processing performed by the partial base sequence creation unit 102a, and obtains the target gene base sequence file 1 0 6a is stored in a predetermined storage area, and partial base sequence information, which is a sequence portion having a predetermined number of bases, of the base sequence information is created, and the created partial base sequence information is stored in a partial base sequence file 106. It is stored in a predetermined storage area of b (step SA-1).
  • step SA-1 the partial nucleotide sequence creation unit 102a is processed by the region-designated nucleotide sequence creation unit 102i so that the target gene coding region or the transcription region of the nucleotide sequence information is processed. Even if partial base sequence information of a predetermined number of bases is created from a site corresponding to the above, the created partial base sequence information is stored in a predetermined storage area of the partial base sequence file 106b. Good.
  • the partial base sequence generator 102a performs processing by the common base sequence generator 102j to obtain information on a plurality of base sequences derived from different organisms (for example, a human base sequence). Information and the mouse base sequence information), create partial base sequence information having a predetermined number of bases in common, and store the created partial base sequence information in a predetermined storage area of the partial base sequence file 106 b. You can store it in.
  • common partial base sequence information having a predetermined number of bases common to a plurality of similar base sequence information in the same species may be created.
  • the partial base sequence generator 102a is derived from a different organism by the processing of the region designation base sequence generator 102i and the common base sequence generator 102j. Creates common partial base sequence information with a predetermined number of bases from sites corresponding to the coding region or transcription region of the target gene of multiple base sequence information, and converts the created partial base sequence information into a partial base sequence It may be stored in a predetermined storage area of the file 106b. In addition, common partial base sequence information having a predetermined number of bases may be created from a region corresponding to a target gene coding region or a transcription region of a plurality of similar vehicle base sequence information of the same species. .
  • the partial nucleotide sequence creating section 102a performs processing of the overhanging site-containing nucleotide sequence creating section 102k to remove the overhang site.
  • Included partial base sequence information may be created. More specifically, for example, the partial base sequence creation unit 102a may include an overhang site-containing portion indicating that the overhang site is included by the processing of the overhang site-containing base sequence creation unit 102k.
  • the partial base sequence information to which the information has been added may be created, and the created partial base sequence information and the overhang site containing information may be correlated with each other and stored in a predetermined storage area of the partial base sequence file 106b. .
  • the upper limit of the predetermined number of bases is preferably 28 or less, more preferably 22 or less, and still more preferably 20 or less when the overhang site is not included. Is preferably 32 or less, more preferably 26 or less, and still more preferably 24 or less.
  • the predetermined lower limit of the number of bases is preferably 13 or more, more preferably 16 or more, and still more preferably 18 or more when not including an overhang site, and when including an overhang site, It is preferably 17 or more, more preferably 20 or more, and further preferably 22 or more.
  • the most preferable predetermined number of bases is 19 when no overhang site is included, and 23 when an overhang site is included.
  • the base sequence processing apparatus 100 performs the processing of 3, terminal base determination section 102b, and based on the partial base sequence information generated in step SA-1, the terminal base is 3, adenine, It is determined whether or not the force is thymine or peracil, and the result of the determination is stored in a predetermined storage area of the determination result file 106c (step SA-2). More specifically, for example, the base sequence processing apparatus 100, by the processing of the 3, terminal base determination unit 102b, can determine the 3, terminal base of the partial base sequence information created in step SA-1. “1” may be stored in the predetermined storage area of the determination result file 106 c if it is adenine, thymine, or “ ⁇ ”, and otherwise “0”.
  • the base sequence processing apparatus 100 performs the processing of 5, the terminal base determination section 102c, and the terminal base 5 of the partial base sequence information created in step SA-1 is guanine. Alternatively, it is determined whether or not the force is cytosine, and the result of the determination is stored in a determination result file 106c in a predetermined storage area (step S # -3). Specifically, for example, the base sequence processing apparatus 100 performs processing by the terminal base determination unit 102 In the partial base sequence information created in step SA-1, the number 5 is “1” when the terminal base is guanine or cytosine, and “0” otherwise. Determined in the result file 106 c It may be stored in a storage area.
  • the base sequence processing apparatus 100 by the processing of the specific base content determination unit 102d, obtains the base sequence consisting of the 3 and 7 terminal bases of the partial base sequence information created in step SA-1.
  • the information is used to determine whether or not one or more bases selected from the group consisting of adenine, thymine, and peracyl are rich in base sequence information, and the result of the determination is used as a determination result file 106 c (Step SA-4).
  • the base sequence processing apparatus 100 performs the processing of the specific base content determination section 102d to perform processing on the partial base sequence information 3 and the terminal 7 bases of the partial base sequence information created in step SA_1.
  • the number of one or more bases selected from the group consisting of adenine, thymine, potato, and peracyl included in the base sequence information consisting of the following is stored in the predetermined storage area of the result file 106c. May be.
  • the determination rule in step SA-4 is that the base sequence information near the 3 'end of the partial base sequence information created in step SA-1 is selected from the group consisting of adenine, thymine, and peracil1 Species or two or more bases are specified as rich base sequence information.
  • base sequence information within the range of 3, 7 bases from the end is adenine, thymine
  • One or two or more bases selected from the group consisting of, and peracyl are defined as rich base sequence information.
  • the “rich nucleotide sequence information” is the “rich sequence” described in the above ⁇ 1> RNA interference target nucleotide sequence search method, and specifically,
  • the base sequence information consisting of the 3 ′ terminal ⁇ base of the partial base sequence information is adenine, thymine, and It is base sequence information containing at least one or more bases selected from the group consisting of peracyl at least preferably at least three bases, more preferably at least four bases, particularly preferably at least five bases.
  • the overhang portion of the partial base sequence information is determined.
  • the sequence site excluding the position is determined as a determination target.
  • the base sequence processing apparatus 100 performs a step based on the results determined in step SA-2, step SA-3, and step SA-4 by the processing of the specified sequence selecting section 102e. From the partial nucleotide sequence information created in SA-1, select the specific sequence information that causes RNA interference specifically to the target gene, and store it in the predetermined storage area of the specific sequence file 106d ( Step SA—5).
  • the base sequence processing apparatus 100 determines that the 3 ′ terminal base is adenine, thymine, or peracil in step SA-2 by the processing of the specified sequence selection unit 102 e.
  • the base at terminal 5 is determined to be guanine or cytosine
  • the base consisting of the partial base sequence information 3 terminal 7 bases in step SA-4 Selecting, as defined sequence information, partial base sequence information in which one or more bases selected from the group consisting of adenine, thymine, and peracil are determined to be rich base sequence information; Rules Store in the specified storage area of the sequence file 106 d.
  • the base sequence processing apparatus 100 performs step SA-2, step SA-3, and step SA-4 by the processing of the specified sequence selecting section 102e. May be calculated based on the value of the product, and the specific sequence information may be selected from the partial base sequence information created in step SA-1 based on the value of the product.
  • the base sequence processing apparatus 100 adds an overhang site to at least one end of the specified sequence information selected in step SA-5 by the processing of the overhang site addition section 102f. Then, it may be stored in a predetermined storage area of the specified sequence file 106 d. More specifically, for example, the base sequence processing apparatus 100 performs the processing of the overhang portion adding section 102 f so that the base sequence processing apparatus 100 stores the specified sequence stored in the specified sequence information section of the specified sequence file 106 d.
  • the sequence information may be rewritten to prescribed sequence information in which an overhang site is added to at least one end. For example, when searching for the target side, overhang sites may be added to both ends of the specified sequence information.
  • the number of bases at the overhang site described above may cause ⁇ 2> RNA interference as described above. This is the number of bases described in the method for designing a base sequence of a polynucleotide to be made, and specifically, for example, 2 is particularly preferable.
  • the ⁇ direct sequence processing apparatus 100 converts the base sequence information identical or similar to the specified sequence information selected in step SA-5 into another base sequence by the processing of the identical similar base sequence search unit 102g.
  • Sequence information eg, nucleotide sequence information published in public databases such as NCB I's RefSeq. Search using existing homology search methods such as BLAST, FASTA, and ssearc li. Based on the same or similar nucleotide sequence information searched by the unrelated gene target evaluation process performed by the target evaluation unit 102h, the specified sequence information targets genes that are unrelated to the target gene. It may be evaluated whether or not.
  • the base sequence processing apparatus 100 by the processing of the same and similar base sequence search unit 102g, converts base sequence information identical or similar to the specified sequence information selected in step SA-5 into Other base sequence information (eg, base sequence information published in public databases such as NCB I's RefSeq) can be obtained by using existing homology search methods such as BLAST, FASTA, and ssearc li.
  • base sequence information eg, base sequence information published in public databases such as NCB I's RefSeq
  • existing homology search methods such as BLAST, FASTA, and ssearc li.
  • the searched and irrelevant gene target evaluation unit 102h calculates the total number of base sequence information of the genes irrelevant to the target gene among the searched same or similar base sequence information, and Degree of similarity based on the value indicating the degree of similarity attached to the nucleotide sequence information of genes unrelated to the target gene (for example, “Eva 1 ue” for BLAST, FASTA and ssearc li)
  • the sum of the reciprocals of the indicated values is calculated, and the unrelated gene target evaluation unit 102h targets the gene whose specified sequence information is unrelated to the target gene based on the calculated sum by the processing of the sum total evaluation unit 102 ⁇ . You may evaluate whether to do it or not.
  • FIG. 24 is a flowchart showing an example of the irrelevant gene target evaluation processing of the present system in the present embodiment.
  • the base sequence processing apparatus 100 Base sequence information that is the same as or similar to the specified sequence information selected in step SA-5, and is published in other base sequence information (for example, in a public database such as RefSeq of NCBI). Base sequence information) A search was performed using existing homology search methods such as BLAST, FASTA, and ssearch, and the identification information of the specified sequence information (“partial base sequence identification information” in FIG. 19) was retrieved. Identification information of the same or similar nucleotide sequence information (“reference sequence identification information” in FIG.
  • the unrelated gene target evaluation unit 102h calculates the total number of base sequence information of genes irrelevant to the target gene among the searched same or similar base sequence information. Based on the value indicating the degree of similarity attached to the nucleotide sequence information of genes unrelated to the target gene (for example, “Eva 1 ue” in the case of BLAST, FASTA and searchssearch), The sum of the reciprocals of the values indicating the values of the specified sequence information is calculated, and the identification information of the specified sequence information (“partial base sequence identification information” in FIG. 20) and the calculated sum (“sum” in FIG. 20) are calculated. It is stored in a predetermined storage area of the evaluation result file 106 g in association with each other (step SB-1).
  • the unrelated gene target evaluator 102h performs processing of the sum reference evaluator 102 ⁇ based on the sum calculated in step SB-1 (for example, the magnitude of the sum calculated in step SB-1). ), And evaluates whether the specified sequence information has the ability to target genes unrelated to the target gene, and evaluates the evaluation results ("non-target” and "target” in Fig. 20) in the evaluation result file 106g. (Step SB-2).
  • the base sequence processing apparatus 100 performs processing in a stand-alone form has been described as an example, but the processing is performed in response to a request from a client terminal configured in a separate housing from the base sequence processing apparatus 100.
  • the processing result may be returned to the client terminal.
  • the client terminal transmits the name of the target gene of RNA interference (eg, gene name, accession number, etc.) or the base sequence information relating to the target gene to the base sequence processing device 100, and performs base sequence processing.
  • the apparatus 100 performs the above-described processing performed by the control unit 102 on the base sequence information corresponding to the name or the base sequence information transmitted from the client terminal, and specifies that the target gene specifically causes RNA interference.
  • sequence information may be selected and transmitted to the client terminal.
  • sequence information may be obtained from a public database for the gene of the query and siRNA may be selected.
  • siRNA of all genes may be calculated and stored in advance,
  • the siRNA may be immediately selected and the selected siRNA may be returned to the client terminal.
  • the base sequence processing apparatus 100 may confirm the specificity of the specified sequence information for a gene that is not related to the target gene. As a result, it is possible to select specific sequence information that specifically causes RNA interference with only the target gene.
  • this system composed of a client terminal and the base sequence processing device 100 includes, for example, a user of a web page, an RNA interference effect of siRNA (for example, “effective,” “effective,” The results of the above are fed back on the web, and the experimental examples fed back from the user are accumulated in the base sequence processor 100 to improve the sequence regularity of siRNA effective for RNA interference as described above. An interface function for performing this may be introduced.
  • the base sequence processing apparatus 100 may calculate the base sequence information of the sense strand of the siRNA and the base sequence information of the antisense strand complementary to the sense strand from the specified sequence information. ,. Specifically, for example, the base sequence W
  • the processing apparatus 100 selects ⁇ ca CCC tgacccgcttcgtcatg gj as sequence information of 23 bases in which two bases each having an overhang are added to both ends of the specified sequence.
  • Information Calculate "5, -CC CUGACCCGCUUCGUCAUGG-3 'J" and base sequence information "5'-AUGACGAAGCGGGUCAGGGUG-3'" of antisense strand. This eliminates the need to manually assemble the sense strand and antisense strand when ordering a polynucleotide, thus increasing convenience.
  • all or a part of the processes described as being performed automatically may be manually performed, or the processes described as being performed manually may be performed. All or part can be performed automatically by a known method.
  • each processing function performed by the control unit 102 all or any part of the processing function is replaced by a CPU (Central Processing Unit). Also, it can be realized by a program interpreted and executed by the CPU, or can be realized as hardware by wired logic. The program is recorded on a recording medium to be described later, and is mechanically read by the base sequence processing device 100 as necessary.
  • a CPU Central Processing Unit
  • a computer program for giving instructions to the CPU in cooperation with an OS (Operating System) and performing various processes is recorded in the storage unit 106 such as a ROM or an HD.
  • This computer program is executed by being loaded into a RAM or the like, and forms a control unit 1 2 in cooperation with the CPU.
  • this computer program is transmitted to the base sequence processor 100.
  • the program may be recorded in an application program server connected via an arbitrary network 300, and it is also possible to download all or part of the program as needed.
  • the program according to the present invention can be stored in a computer-readable recording medium.
  • the “recording medium” refers to any “portable physical medium” such as a flexible disk, a magneto-optical disk, R ⁇ M, EPROM, EE PROM, CD-ROM, M ⁇ , DVD, flash disk, etc. , Or any "fixed physical medium” such as ROM, RAM, HD, etc. built in various computer systems, or a communication line for transmitting programs via a network represented by LAN, WAN, or the Internet. It includes “communications media” that hold programs for a short time, such as carrier waves.
  • a “program” is a data processing method described in an arbitrary language or description method, regardless of the format such as source code and binary code. Note that a “program” is not necessarily limited to a single program, but may be distributed with multiple module libraries or a separate program such as an operating system (OS). Including those that work to achieve that function.
  • OS operating system
  • Known structures and procedures can be used for a specific configuration for reading the recording medium in each device described in the embodiment, a reading procedure, an installation procedure after reading, and the like.
  • Various databases (target gene base sequence file 106a to target gene annotation database 106h) stored in the storage unit 106 include memory devices such as RAM and ROM, fixed disk devices such as hard disks, and flexible disk devices. It is a storage means such as disk, optical disk, etc., and stores various programs used for various processing and web site provision, files for tableware, file for database of finale, etc.
  • the base sequence processing device 100 connects peripheral devices such as a printer monitor and an image scanner to an information processing device such as an information processing terminal such as a known personal computer or a workstation, and connects the information processing device to the information processing device.
  • Software for implementing the method of the present invention May be realized by implementing software (including programs, data, etc.).
  • the specific form of dispersion and integration of the base sequence processing device 100 and the like is not limited to those shown in the description and drawings, and may be all or Some of them can be configured to be functionally or physically distributed and integrated in arbitrary units according to various loads, etc. (eg, grid 'computing).
  • each database may be independently configured as an independent database device, and a part of the processing may be realized by using CGI (Common Gateway Interface).
  • the network 300 has a function of interconnecting the base sequence processing apparatus 100 and the external system 200.
  • the Internet 300 the intranet 2, a LAN (including both wired Z wireless), VAN, , PC communication network, public telephone network (including both analog and digital), leased line network (including both analog and digital), CATV network, IMT2000 system, 03: ⁇ system or
  • the target gene for measuring the RNAi effect of s i RNA is firefly (
  • Phosti nu spyralis, P. pyraiis) luciferase (1 uc) gene (P. pyralis 1 uc gene: accessionnumer: U47296) was used as an expression vector containing the same.
  • PGL3_Control vector (produced by Pharmaga) was used.
  • the P. Pyra 1 is 1 uc gene fragment is sandwiched between the SV40 promoter and the polyA signal in this vector.
  • the internal control gene used was the luc gene of ⁇ -mushroom (Renillareniformis, R. reniformis), and pRL-TK (promega) was used as an expression vector containing the same.
  • RNA 1-base double-stranded RNA (si RNA) synthesis
  • the 21-base sense strand and the 21-base antisense strand RNA were commissioned to Genset Inc. through Hitachi Instrument Service Co., Ltd. .
  • the double-stranded RNA used to inhibit the expression of the P. pyra1is1uc gene was prepared by associating a sense strand with an antisense strand. The association was performed by heating the sense strand RNA and the antisense strand RNA in a 1 OmM Tris-HCl (pH 7.5), 2 OmM NaC1 reaction solution at 90 ° C for 3 minutes, Incubation was performed for 1 hour at room temperature and then allowed to stand until room temperature.
  • double-stranded polynucleotides The formation of double-stranded polynucleotides is assayed by electrophoresis on a 2% agarose gel in TBE buffer.Under the above conditions, almost all single-stranded polynucleotides are converted to double-stranded polynucleotides. Was meeting.
  • Mammalian cells are seeded on a 24-well plate at a concentration of 0.2 to 0.3 x 10 6 ce 11 s Zm1, and one day later, Ca-phosphate precipitation method (Cell Engineering Handbook, edited by Toshio Kuroki et al. (1992)) with 1.O ⁇ g pGL3-Conntro 1 DNA, 0.5 or 1.0 ⁇ g gp RL-TK DNA, and 0.01, 0.1, 1, 10, 1 ⁇ 0 nM Each siRNA was introduced.
  • S2 cells (Schneider, I., eta1, J. Embryo 1.E. Morphh., 27, 353-365 (1972)) were used as cultured cells of Drosophila.
  • the medium was Schneider's Dx
  • S2 cells are; Spread at a concentration of 0 X 10 6 ce 11 1 s / m 1 on a 24-well plate, and after one day, Ca—phosphate precipitation method (Cell Engineering Handbook, edited by Norio Kuroki et al., Yodosha (1992) ), 1.0 g pGL-3 Control DNA, 0.1 ugp RL-TK DNA, and 0.01, 0.1, 1, 10, and 100 nM of each siRNA were introduced.
  • FIG. 10 shows the results of measuring the luciferase activity.
  • FIG. 11 shows the results of examining the correspondence between luciferase activity and each nucleotide sequence. .
  • the graph shown by B shows the result in Drosophila
  • the graph shown by C shows the result in human.
  • luciferase activity could be suppressed in most sequences by preparing RNA having 21 bases.
  • sequence strength S capable of suppressing luciferase activity simply by setting the number of bases to 21.
  • the regularity of the nucleotide sequences of the RNAs a to p was analyzed.
  • the nucleotide sequence was analyzed at five sites of the double-stranded RNA.
  • the relative activity of luciferase (RLA) is 0.03
  • that of the antisense strand is 3
  • the base of the overhang (OH) is 3
  • the G / C content (the content of guanine or cytosine) in the sequence UC, followed by the 7 bases (3, 1 T in Fig. 11) is 57%, and the G of the next 5 bases (M in Fig. 11).
  • the G / C content of the next 7 bases is 14%, the 5 'end is U, and the total G / C content is 7 The amount is 32%.
  • the lower the value of RLA the lower the activity of RLA, that is, the more suppressed the expression of NF.
  • nucleotide sequence of the polynucleotide causing RNA interference has a very high probability that the 3 'end is adenine or peracyl and the 5' end is guanine or cytosine.
  • adenine or peracyl was abundant in the 7 bases at the 3 ′ end.
  • target expression vector pTREC The target expression vector was constructed as described below.
  • the target expression molecule is a molecule that expresses RNA having a sequence to be a target of RNAi (hereinafter sometimes referred to as “target sequence”).
  • a target mRNA sequence was constructed downstream of the CMV enhancer / promoter of pCI-neo (GenBank Accession No. U47120, manufactured by Promega) (FIG. 25). That is, Kozak sequence (Ko zak), ATG sequence, target 23 base pair sequence cloning site (target), and restriction enzymes for recombination (Nhe I, Eco RI, Xho I) recognition sequence
  • the following double-stranded oligomer having the following formula was synthesized.
  • the double-stranded oligomer comprises the sequence shown in SEQ ID NO: 1 in the sequence listing and its complementary sequence.
  • the synthesized double-stranded oligomer was inserted into the NheI and XbaI sites of pCI-neo to construct a target expression vector pTREC (FIG. 25). Note that the intron was originally incorporated into C-neo—a globin-derived intron site was used.
  • the pTREC shown in FIG. 25 can include a promoter and enhancer (pRoZen), and regions PAR (F) 1 and PAR (R) 1 corresponding to PCR primers.
  • An intron (Intron) is inserted between PAR (F) 1 and the expression vector itself is designed so that it does not become a type II PCR.
  • the intron site is removed and PAR (F) 1 is ligated in an environment where splicing is performed, such as in eukaryotic cultured cells, after RNA transcription.
  • RNA formed from pTREC can be amplified by RT-PCR.
  • As an intron a ⁇ -globin-derived intron site originally included in pCI-neo was used.
  • the neomycin resistance gene (neo) was incorporated into pTREC as a control. PCR primers corresponding to a part of the sequence in the neomycin resistance gene were prepared, and RT-PC was used for a part of the neomycin resistance gene. By performing R, the neomachine resistance gene can be used as an internal standard control (internanore control).
  • PAR (F) 2 and PAR (R) 2 The region corresponding to the PCR primer in the neomycin resistance gene is shown.
  • an intron can be inserted between at least one of PAR (F) 2 and PAR (R) 2.
  • HeLa cells are seeded per well of a 24-well plate, and after 1 day, 0.5 ⁇ g according to the manual using Lipofectamine 2000 (manufactured by Invitrogen) according to the manual. Of p TREC vector was transfected.
  • One-320th of the obtained cDNA was used as a PCR template, and quantitative PCR was performed in a reaction system of 501 using SYBR Green PGR Master Mix (manufactured by Applied Biosystems) to obtain target mRNA (mRNA (T) And mRNA derived from the neomycin resistance gene on pTREC (designated mRNA (C)) as an internal control.
  • ABI PRIZM7000 manufactured by Applied Biosystems was used for quantitative PCR, and a primer pair T (SEQ ID NOs: 2 and 3 in the Sequence Listing) was used for quantification of mRNA (T), and a primer was used for quantification of mRNA (C).
  • a pair C SEQ ID NO: 4, 5 in the Sequence Listing was used.
  • FIGS. 26 and 27 show the results of the PCR.
  • FIG. 26 and FIG. 27 are graphs in which the vertical axis represents each PCR product and the horizontal axis represents the number of PCR cycles.
  • the difference in amplification of the amount of PCR product obtained between the cDNA synthesized with reverse transcriptase (+ RT) and the control without reverse transcriptase (one RT) was small ( ( Figure 26). This indicates that not only the cDNA but also the vector remaining in the cells was amplified as a type II PCR.
  • Sequences corresponding to 812-834, 35-57 of the human vimentin (VIM) gene (RefSeqID: rain-003380) coding region were evaluated. Synthetic oligonucleotides (evaluation sequence fragments) having these sequences and the recognition sequences of EcoRI and Xliol and having SEQ ID NOs: 6 and 7 in the following Sequence Listing were prepared.
  • Evaluation sequence VIM35 (SEQ ID NO: 8, Fig. 28), evaluation sequence VIM812 (SEQ ID NO: 9, Fig. 29), and control sequence (siContorol, sequence number 10) , Fig. 30) were synthesized and annealed. In each of the following siRNA sequences, an overhang is provided at the 3 'end.
  • si RNA against the luciferase gene was used as a control.
  • 0.2-0.3 ⁇ 10 6 ce 11 s of HeLa cells are seeded per well of a 24-well plate, and one day later, Lipofectamine 2000 (manufactured by Invitrogen) is used according to the manual.
  • 0.5 ⁇ g of pTREC-VIM35 or pTREC-VIM812 and 100 nM of siRNA (siVIM35, siVIM812) corresponding to the respective VIM-derived sequences were transfected simultaneously.
  • Control cells were transfected with 0.5 g of pTREC-VIM35 or pTREC-VIM812 and 100 nM of siRNA (si Control) for the luciferase gene at the same time.
  • RNA was extracted using Trizol (Invitrogen). Using 100 ng of this RNA, oligo (dT) was used as a primer and reverse transcribed with Superscript II RT (Invitrogen) to obtain cDNA. 1/320 of the obtained cDNA was used as a PCR template, and quantitative PCR was performed in 501 reaction systems using SYBR Green PCR Master Mix (manufactured by Applied Biosystems). MRNA (referred to as mRNA (T)) containing the following sequence and mRNA (referred to as mRNA (referred to as C) derived from the neomycin resistance gene on pTREC as an internal control.
  • T mRNA
  • C mRNA
  • VIM-F3-84 gagctacgtgactacgtcca (SEQ ID NO: 11) VIM-R3-274; gttcttgaactcggtgttgat (SEQ ID NO: 12).
  • PCR was performed using the primers ACTB-F2-481 and ACTB-R2-664 (SEQ ID NOs: 13 and 14) for / 3-actin, and the quantitative values of 0-actin between the samples were matched. Then, the expression amount of vimentin was evaluated.
  • FIG. 33 shows the result of observation with a fluorescence microscope.
  • the portions appearing white in each of the nine frames are fluorescent portions.
  • EGFP and Yes the same level of expression was confirmed in all cells.
  • siControl and siVIM35 were introduced, fluorescence due to vimentin antibody staining was observed, and the presence of endogenous vimentin was confirmed.
  • the fluorescence was significantly weaker than in the cells into which siControl and siVIM35 were introduced. This result indicates that the interference of endogenous vimentin mRNA with siV IM812 resulted in a decrease in the expression level of vimentin protein. It was revealed that IM812 also had an RNAi effect on endogenous vimentin mRNA.
  • the nucleotide sequence was designed based on the above prescribed rules (a) to (d).
  • the nucleotide sequence was designed by using a nucleotide sequence processor that executes the siRNA sequence design program described above.
  • the nucleotide sequences include 15 types of sequences predicted to have RNAi activity (SEQ ID NOS: 15 to 29) and 5 types of sequences predicted to have no RNAi activity (SEQ ID NOS: 30 to 34). was prepared.
  • RNAi activity was evaluated by measuring the luciferase activity in the same manner as in Example 1 except that the target sequence and the siRNA to be evaluated were prepared based on the designed sequence. The results are shown in FIG. Those with low relative luciferase activity are in effect, i.e., sRNA with RNAi activity
  • RNAi activity was evaluated by performing the same assays as in Example 2 above, except that the target sequence and the sequence to be evaluated were changed, respectively.
  • s i RNA is derived from the SAR S virus genome by 3CL-PR0, RdRp, Spike glycoprotein ⁇ Small envelope E protein ⁇ Membrane glycoprotein M,
  • RNAs incorporating the corresponding siRNA sequences as targets.
  • the relative target mRNA amount when each sRNA of SARS is inserted is shown assuming that the case where sicRNA 1 (sequence unrelated to SARS) is inserted is 100%.
  • sicRNA 1 sequence unrelated to SARS
  • siControl [Designed siRNA sequence (excluding the specified sequence and overhang)] siControl; gggcgcggtcggtaaagtt (IB system IJ number 35)
  • Spike glycoprotein SARS-23341; gcttggcgcatatattcta (SEQ ID NO: 39) Spike glycoprotein; SARS-24375; cctttcgcgacttgataaa (SEQ ID NO: 40) Small envelope E protein; SARS-26233; gtgcgtactgctgcaatat (SEQ ID NO: 41)
  • Small envelope E protein SARS-26288; ctactcgcgtgttaaaaat (SEQ ID NO: 42)
  • Membrane glycoprotein M SARS-26399; gcagacaacggtactatta (distribution lj number 43) Membrane glycoprotein M; SARS-27024; 5) s2m motif; SARS-29606; gatcgagggtacagtgaat (rooster 3 row number 4 6)
  • siRNAs were designed according to the above “ ⁇ 5> siRNA sequence design program” and “ ⁇ 7> siRNA sequence design program, etc.”.
  • the designed sequences of siRNA are shown in SEQ ID NOs: 47 to 892 in the sequence listing.
  • NM 000604, Homo sapiens ribroblast growth iactor receptor ⁇ (ims—related tyrosine kinase 2, Pfeiffer syndrome) (FGFR1).
  • FGFR1 Homo sapiens ribroblast growth iactor receptor ⁇ (ims—related tyrosine kinase 2, Pfeiffer syndrome) (FGFR1).
  • gagttcatgtgtaaggtgt (Rooster S system ⁇ Number 52)
  • Hiring 000141, Homo sapiens fibroblast growth factor receptor 2 (bacteria-expressed kinase, keratinocyte growth factor receptor, craniofacial dysostosis 1, Crouzon syndrome, Pfeiffer syndrome, Jackson-Weiss syndrome) (FGFR2).
  • fibroblast growth factor receptor 2 bacteria-expressed kinase, keratinocyte growth factor receptor, craniofacial dysostosis 1, Crouzon syndrome, Pfeiffer syndrome, Jackson-Weiss syndrome
  • gaggctacaaggtacgaaa (SEQ ID NO: 53)
  • cacacgacctgtacatgat (Rooster his own column number 64)
  • gagttccactgcaaggtgt (Rooster 3 row number 65)
  • RNAi target genes Rin — 004448, Homo sapiens v-erb-b2 erythroblastic leukemia viral oncogene homolog 2, neuro / lioblastoma derived oncogene homolog (avian) (ERBB2). (Target sequence)
  • ERBB3 Homo sapiens v-erb-b2erythroblastic leukemia viral oncogene homolog 3 (avian) (ERBB3).
  • Marauder 005235
  • Homo sapiens v-erb a erythroblastic leukemia viral oncogene homolog 4 (avian) (ERBB4).
  • RNAi target genes Bandai 002227, Homo sapiens Janus kinase 1 a Orotem tyrosine kinase (JAKl).
  • Oichi 004972 Homo sapiens Janus kinase 2 (a protein tyrosine kinase; (JAK2).
  • gaggccgagcgcaaacttt (SEQ ID NO: 108)
  • gagctctgcgagttctact location (J number 110)
  • gacacgagcgtgtatgaga (SEQ ID NO: 111)
  • RNAi target genes NM_005417, Homo sapiens v-src sarcoma (Schmidt-Ruppin A-2) viral oncogene homolog (avian) (SRC).
  • NM_002350 Homo sapiens v-yes-1 Yamaguchi sarcoma viral related oncogene homolog (LY).
  • gagggcgtgtggaagaaat SEQ ID NO: 127)
  • Pp. 005158 Homo sapiens v-abl Aoelson murine leukemia viral oncogene homolog 2 (arg, Abel son-related gene) (ABL2).
  • M_001291 Homo sapiens CDC- like kinase 2 (CLK2).
  • NM_001291-405 ggagttaccgtgaacacta (SEQ ID NO: I 47 )
  • SRPK2 Homo sapiens SFRS protein kinase 2
  • gagaaatcgcccaacttct (rooster S row number 180)
  • NM_003391-764 gctaacgagaggtttaaga (SEQ ID NO: 185)
  • gacgagtgtcagtttcagt (SEQ ID NO: 196)
  • RNAi target genes ⁇ -004626, Homo sapiens wingless-type MMTV integration site family, member 11 (W T11).
  • NM_0307oo Homo sapiens wingless-type MMTV integration site family, member 3 ( ⁇ T3).
  • ⁇ _033 J1, Homo sapiens wingless-type MMTV integration site family, member 3A (W T3A).
  • gaggcctcgcccaacttct (rooster 3 row number 215)
  • NM_033131-50 ggcagctacccgatctggt (SEQ ID NO: 217)
  • CDKLl Homo sapiens cyclin-dependent kinase-like 1 (CDC2-related kinase)
  • CDKL2 Homo sapiens cyclin-dependent kinase- like 2 (CDC2-related kinase)
  • NM_003948-626 cagctatatcatattatga (SEQ ID NO: 237)
  • NM_003948-325 gattattaatggaattgga (SEQ ID NO: 238) ' ⁇ -003948-1012, ggtacaggataccaatgct (SEQ ID NO: 239)
  • CDKL3 Homo sapiens cycl in-dependent kinase-like 3
  • gagctcccgaattagtatt (SEQ ID NO: 240)
  • Thigh 016508-1290, cacccatcaatctaactaa (Rooster self number 242)
  • Thigh 016508-501, ctcccgaattagtattaaa (Rooster S row number 244)
  • RNAi target genes ⁇ — 002745, Homo sapiens mitogen-activated protein kinase 1 (MAPKl). (Target sequence)
  • NLK Homo sapiens nemo-like kinase
  • NM_016231-1384 ccgacaggttaaagaaatt (SEQ ID NO: 262)
  • NM_001315-403 ccgaggtctaaagtatata (Rooster self number 264)
  • MAPKll mitogen-activated protein kinase 11
  • gaggttctggcaaaaatct (SEQ ID NO: 272)
  • NM— 002969 Homo sapiens mitogen-activated protein kinase 12 (MAPK12). (Target sequence)
  • NM_002969-262 gctgctggacgtattcact (SEQ ID NO: 275 )
  • gagagctagttcttatgaa (Rooster column number 2 ⁇ 5)
  • NM_139049-524 gcaggaacgagttttatga (SEQ ID NO: 288)
  • NM_002752-878 gccagagatctgttatcaa (SEQ ID NO: 292 )
  • NM_002752-880 cagagatctgttatcaaaa (SEQ ID NO: 294)
  • MAPKIO mitogen-activated protein kinase 10
  • CDK2 cycl in-dependent kinase 2
  • CDK4 Homo sapiens cycl in-dependent kinase 4
  • CDK7 Homo sapiens cycl in-dependent kinase 7 (M015 homolog, Xenopus ⁇ aevis, cdk-activating kinase) (CDK7).
  • STK11 Homo sapiens serine / threonine kinase 11 (Peutz-Jegners syndrome) (STK11).
  • gaggttacggcacaaaat SEQ ID NO: 328
  • NM_001274-456 cagtatttcggtataataa (SEQ ID NO: 333)
  • NM_001274-361 gcatggtattggaataact (SEQ ID NO: 33 4)
  • PIM1 Homo sapiens pim-loncogene
  • TRB2 Homo sapiens tribbles homolog 2
  • NM_021643-71 gaagagttgtcgtctataa (SEQ ID NO: 35 4) M_021643-177, gtatcgggaaatacttatt (SEQ ID NO: 355)
  • gagcagatcgtcatattca (Rooster self number 363)
  • DAPKl Homo sapiens death-associated protein kinase 1
  • NM_006252-1338 ctggcaattacgtgaaaat (SEQ ID NO: 376)
  • Marauder—003684 Homo sapiens MAP kinase-interacting serine / threonine kinase 1 (MKNKl).
  • gagtatgccgtcaaaatca (SEQ ID NO: 385)
  • MAPKAPK2 Homo sapiens mitogen—activated protein kinase—activated protein kinase 2 (MAPKAPK2).
  • CAMK2G Homo sapiens calcium / calmodul in-dependent protein kinase (aM kinase) II gamma
  • gagtacgcagcaaaatca (Rooster number 395)
  • CiM kinase II alpha CAMK2A
  • NM_015981-1066 gcggaaacaggaaattata (SEQ ID NO: 40 ⁇ )
  • gagtcctacacgaagatgt (rooster 3 row number 407)
  • PDK1 Homo sapiens pyruvate dehydrogenase kinase, isoenzyme 1 (PDK1).
  • NM_002610-388 ggatgctaaagctatttat (SEQ ID NO: 429)
  • gacaaaaagcgcatcaaga (Iris number 432)
  • gagagtcccggcaaaattt (SEQ ID NO: 4 38 )
  • cagaagtcgacaaatttat (SEQ ID NO: 441)
  • NM— 014496 Homo sapiens ribosomal protein S6 kinase, 90kDa, polypeptide 6 (RPS6KA6). (Target sequence)
  • gaggctagtgatatactat (Distribution system number) 50
  • NM_0029DJ Homo sapiens ribosomal protein S6 kinase, 90kDa, polypeptide

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Virology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、RNA干渉の標的遺伝子の塩基配列から、下記(a)から(d)の規則に従う配列部位を検索し、検索結果に基づきRNAiを生じさせるsiRNAの設計、合成等を行う。(a)3'末端の塩基が、アデニン、チミンまたはウラシルである。(b)5'末端の塩基が、グアニンまたはシトシンである。(c)3'末端の7塩基の配列において、アデニン、チミンおよびウラシルからなる群より選ばれる1種または2種以上の塩基がリッチである。(d)塩基数が、細胞毒性を生じさせずにRNA干渉を生じさせ得る数である。

Description

R N A干渉の標的塩基配列検索方法、 R N A干渉を生じさせるポリヌクレオチド の塩基配列設計方法、 2本鎖ポリヌクレオチドの作製方法、 遺伝子の発現抑制方 法、 塩基配列処理装置、 塩基配列処理方法をコンピュータに実行させるプロダラ ム、 記録媒体、 および、 塩基配列処理システム 技術分野
本発明は、 RNA干渉 (RNA i n t e r f e r e n c e) に関し、 詳しく は、 RNA干渉を利用した試験、 製造などの効率を向上させる、 RNA干渉を生 食
'じさせるポリヌクレオチドの配列設計方法等に関する。 以下本明細書において R
NA干渉のことを 「RNAi」 と表記する場合がある。
また、 本発明は、 塩基配列処理装置、 塩基配列処理方法をコンピュータに実行 させるプログラム、 記録媒体、 および、 塩基配列処理システムに関し、 特に RN A干渉の標的遺伝子の塩基配列から、 標的遺伝子に対して RNA干渉を生じさせ る塩基配列を効率よく選択することができる塩基配列処理装置、 塩基配列処理方 法をコンピュータに実行させるプログラム、 記録媒体、 および、 塩基配列処理シ ステムに関する。
背景技術
RNA干渉は、 機能阻害したい遺伝子の特定領域と相同なセンス RNAとアン チセンス RNAからなる 2本鎖 RNA (d o ub l e- s t r a n d e d RN A、 以下 「d s RNA」 という) が標的遺伝子の転写産物である mRN Aの相同 部分を干渉破壊するという現象で、 1998年に線虫を用いた実験により初めて 提唱された。 しかし、 哺乳類においては、 約 30塩基対以上の長い d s RNAを 細胞内へ導入すると、 インターフェロンレスポンスが誘導され、 細胞がアポトー シスによって死んでしまうため、 RNA i法を用いることが困難であった。 一方、 マウス初期胚ゃ哺乳類培養細胞では、 RNA干渉が起こりえることが示 され、 RNA干渉の誘導機構そのものは、 哺乳類細胞にも存在することがわかつ てきた。 現在では、 およそ 21-23塩基対の短い 2本鎖 RNA (s h o r t i n t e r f e r i n g RNA、 s i RNA) 力 哺乳類細胞系でも細胞毒性 を示さずに RN A干渉を誘導できることが示され、 哺乳類においても RNA i法 を利用することが可能となってきている。 発明の開示
RNA i法は様々な応用が期待される技術である。 し力 し、 ショウジョゥバエ や線虫では、 ある遺伝子の特定領域と相同な d s RNAおよび s iRNAは、 ほ とんどの配列で RN A干渉効果を示すのに対して、 哺乳類では無作為に選択した (21塩基の) s i RNAの 70〜80% RNA干渉効果を示さない。 これは 、 哺乳類において RNA i法を用いた遺伝子機能解析を行う際に大きな問題点と なっている。
また、 従来 s i RNAを設計するにあたっては、 試験者等の経験やセンスに依 存する部分が大きく、 実際に; NA干渉効果を示す s i RNAを高い確率で設計 することが困難であった。 さらに、 RNA合成は、 費用、 時間等を要することか ら、 RN A干渉を行うために無駄な s i RNAを合成してしまうことは、 RNA 干渉のさらなる研究や、 RN A干渉を利用した数々の利用法の普及を妨げる要因 となっていた。
以上のような状況の下、 RNAi法をより簡便に効率よく行うことができる手 段を提供することを課題とする。
本発明者らは、 上記課題を解決するために、 RNA i法を用いる際最も労力、 時間、 費用を要する部分の 1つである、 s i RN Aの入手を容易に行う手法につ いて検討を進めた。 s i RN Aの調製は哺乳類において特に問題となっているこ と力 ら、 本発明者らは哺乳類培養細胞系を用いて、 RNA干渉に有効な s i RN Aの配列規則性を同定することを試みたところ、 有効な s i R N Aの配列には所 定の規則性があることを見いだし、 本発明を完成するに至った。 すなわち、 本発 明は、 次の通りである。 〔1〕 RNA干渉の標的遺伝子の塩基配列から、 下記 (a) から (d) の規則 に従う配列部位を検索する、 R N A干渉の標的塩基配列の検索方法。
(a) 3' 末端の塩基が、 アデニン、 チミンまたはゥラシ である。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3' 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。 〔2〕 前記規則 (c) において、 7塩基のうち少なくとも 3塩基以上がアデ二 ン、 チミンおよびゥラシルからなる群より選ばれる 1種または 2種以上である、 上記 〔1〕 に記載の標的塩基配列の検索方法。
〔3〕 前記規則 (d) において、 塩基数が 13〜28である、 上記 〔1〕 また は 〔2〕 に記載の標的塩基配列の検索方法。
〔4〕 下記 (a) から (d) の規則に従う塩基配列を標的遺伝子の塩基配列か ら検索し、 検索された塩基配列と相同な塩基配列を設計する、 RNA干渉を生じ させるポリヌクレオチドの塩基配列設計方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3' 末端の 7塩基の配列において、 アデニン、 チミンおよびゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。 〔 5〕 前記規則 ( c ) におレ、て、 7塩基のうち少なくとも 3塩基以上がアデ- ン、 チミンおよぴゥラ、ンルからなる群より選ばれる 1種または 2種以上である、 上記 〔4〕 に記載の塩基配列設計方法。
〔6〕 設計される相同な塩基配列の塩基数が 13〜28である、 上記 〔4〕 ま たは 〔5〕 に記載の塩基配列設計方法。
〔7〕 前記設計される相同な塩基配列の少なくとも 80%以上の塩基が検索さ れた塩基配列と一致するように設計する、 上記 〔4〕 力 ら 〔6〕 のいずれか一項 に記載の塩基配列設計方法。 〔8〕 検索された塩基配列の 3, 末端の塩基と設計される塩基配列の 3, 末端 の塩基とが同一であり、 かつ、 検索された塩基配列の 5, 末端の塩基と設計され る塩基配列の 5, 末端の塩基とが同一である、 上記 〔4〕 から 〔7〕 のいずれか 一項に記載の塩基配列設計方法。
〔9〕 ポリヌクレオチドの 3, 末端に、 オーバーハング部位を付加する、 上記
〔4〕 から 〔8〕 のいずれか一項に記載の塩基配列設計方法。
〔10〕 2本鎖ポリヌクレオチドの作製方法であって、
一方の鎖が、 標的遺伝子の塩基配列中に含まれる、 下記 (a) から (d) の規則 に従う規定配列と相同な塩基配列の 3, 末端にオーバーハング部を設けて形成さ れ、
他方の鎖が、 前記規定配列と相同な塩基配列と相補的な配列の 3, 末端にオーバ ーハング部を設けて形成され、'
各鎖の塩基数が 1 5〜 30であるように設計された 2本鎖ポリヌクレオチドを合 成する、 2本鎖ポリヌクレオチドの作製方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァユンまたはシトシンである。
(c) 3, 末端の 7塩基の配列において、.アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。 〔1 1〕, RNA干渉の標的遺伝子の塩基配列中から下記 (a) から (d) の規 則に従う塩基数 1 3-28の配列部位を検索し、 一方の鎖が、 標的遺伝子の塩基 配列中に含まれる、 下記 (a) から (d) の規則に従う規定配列と相同な塩基配 列の 3, 末端にオーバーハング部を設けて形成され、 他方の鎖が、 前記規定配列 と相同な塩基配列と相補的な配列の 3 ' 末端にオーバーハング部を設けて形成さ れ、 各鎖の塩基数が 1 5〜 30であるように合成された、 2本鎖ポリヌクレオチ ド、。
(a) 3' '末端の塩基が、 アデユン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。 (c) 3, 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。 〔12〕 RNA干渉の標的遺伝子の塩基配列中から下記 (a) から (d) の規 則に従う塩基数 13-28の配列部位を検索する工程と、
一方の鎖が、 標的遺伝子の塩基配列中に含まれる、 下記 (a) 力 ら (d) の規則 に従う規定配列と相同な塩基配列の 3, 末端にォ一バーハング部を設けて形成さ れ、 他方の鎖が、 前記規定配列と相同な塩基配列と相補的な配列の 3' 末端にォ 一バーハング部を設けて形成され、 各鎖の塩基数が 15〜 30であるように設計 された 2本鎖ポリヌクレオチドを合成する工程と、
合成された 2本鎖ポリヌクレオチドを、 発現を抑制しようとする標的遺伝子の発 現系に添加して標的遺伝子の発現を抑制する工程と、
を含む、 遺伝子発現抑制方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3, 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
' (d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。 〔13〕 RNA干渉の標的遺伝子の塩基配列情報を取得して、 上記塩基配列情 報の予め定めた塩基数の配列部位である部分塩基配列情報を作成する部分塩基配 列作成手段と、 上記部分塩基配列作成手段にて作成された上記部分塩基配列情報 の 3, 末端の塩基がアデニン、 チミン、 または、 ゥラシルである力否かを判定す る 3, 末端塩基判定手段と、 上記部分塩基配列作成手段にて作成された上記部分 塩基配列情報の 5, 末端の上記塩基がグァニン、 または、 シトシンであるか否か を判定する 5, 末端塩基判定手段と、 上記部分塩基配列作成手段にて作成された 上記部分塩基配列情報の上記 3, 末端の 7塩基からなる上記塩基配列情報が、 ·上 記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種ま たは 2種以上の上記塩基がリツチな上記塩基配列情報であるカゝ否かを判定する特 定塩基含有判定手段と、 上記 3, 末端塩基判定手段、 上記 5 , 末端塩基判定手段 、 および、 上記特定塩基含有判定手段にて判定された結果に基づいて、 上記部分 塩基配列作成手段にて作成された上記部分塩基配列情報から上記標的遺伝子に特 異的に上記 R N A干渉を生じさせる規定配列情報を選択する規定配列選択手段と を備えたことを特徴とする塩基配列処理装置。
〔1 4〕 上記部分塩基配列作成手段は、 上記塩基配列情報の上記標的遺伝子の コード領域、 または、 転写領域に対応する部位から、 上記予め定めた上記塩基数 の上記部分塩基配列情報を作成する領域指定塩基配列作成手段をさらに備えたこ とを特徴とする 〔1 3〕 に記載の塩基配列処理装置。
〔1 5〕 上記部分塩基配列作成手段は、 異なる生物に'由来する複数の上記塩基 配列情報の間で共通する、 上記予め定めた上記塩基数の上記部分塩基配列情報を 作成する共通塩基配列作成手段をさらに備えたことを特徴とする 〔1 3〕 または
〔1 4〕 に記載の塩基配列処理装置。
〔1 6〕 上霄己リツチな上記塩基配列情報は、 上記 7塩基からなる上記塩基配列 情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ば れる 1種または 2種以上の上記塩基が少なくとも 3塩基以上含まれる上記塩基配 列情報であることを特徴とする 〔1 3〕 から 〔1 5〕 のいずれか一つに記載の塩 基配列処理装置。
〔1 7〕 上記予め定めた上記塩基数は、 1 3〜2 8であることを特徴とする 〔 1 3〕 から 〔1 6〕 のいずれ力一つに記載の塩基配列処理装置。
〔1 8〕 上記部分塩基配列作成手段は、 オーバーハング部位を含む上記部分塩 基配列情報を作成するオーバーハング部位含有塩基配列作成手段をさらに備えた ことを特徴とする 〔1 3〕 から 〔1 7〕 のいずれか一つに記載の塩基配列処理装 置。
〔1 9〕 上記規定配列情報の少なくとも一方の末端に上記オーバーハング部位 を付加するオーバーハング部位付加手段を備えたことを特徴とする 〔1 3〕 力 ら 〔1 7 ] のいずれか一つに記載の塩基配列処理装置。 .
〔2 0〕 上記オーバーハング部位の塩基数は、 2であることを特徴とする 〔 1 8〕 または 〔1 9〕 に記載の塩基配列処理装置。
〔2 1〕 上記規定配列情報と同一または類似の上記塩基配列情報を他の上記塩 基配列情報から検索する同一類似塩基配列検索手段と、 上記同一類似塩基配列検 索手段にて検索された上記同一または上記類似の上記塩基配列情報に基づいて、 上記規定配列情報が上記標的遺伝子とは無関係の遺伝子を標的にするカゝ否かを評 価する無関係遺伝子標的評価手段とを備えたことを特徴とする 〔1 3〕 から 〔2 0〕 のいずれか一つに記載の塩基配列処理装置。
〔2 2〕 上記無関係遺伝子標的評価手段は、 上記同一類似塩基配列検索手段に て検索された上記同一または上記類似の上記塩基配列情報のうち上記標的遺伝子 とは無関係の上記遺伝子の上記塩基配列情報の総数、 および、 上記標的遺伝子と は無関係の上記遺伝子の上記塩基配列情報に付された同一類似の度合いを示す値 に基づいて、 上記同一類似の度合いを示す値の逆数の総和を算出する総和算出手 段と、 上記総和算出手段にて算出された上記総和に基づいて、 上記規定配列情報 が上記標的遺伝子とは無関係の上記遺伝子を標的にするか否かを評価する総和基 準標的評価手段とをさらに備えたことを特徴とする 〔2 1〕 に記載の塩基配列処 理装置。
〔2 3〕 RN A干渉の標的遺伝子の塩基配列情報を取得して、 上記塩基配列情 報の予め定めた塩基数の配列部位である部分塩基配列情報を作成する部分塩基配 列作成工程と、 上記部分塩基配列作成工程にて作成された上記部分塩基配列情報 の 3, 末端の塩基がアデニン、 チミン、 または、 ゥラシルである力否かを判定す る 3 , 末端塩基判定工程と、 上記部分塩基配列作成工程にて作成された上記部分 塩基配列情報の 5 ' 末端の上記塩基がグァユン、 または、 シトシンであるか否か を判定する 5 ' 末端塩基判定工程と、 上記部分塩基配列作成工程にて作成された 上記部分塩基配列情報の上記 3, 末端の 7塩基からなる上記塩基配列情報が、 上 記アデ二ン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種ま たは 2種以上の上記塩基がリツチな上記塩基配列情報であるか否かを判定する特 定塩基含有判定工程と、 上記 3, 末端塩基判定工程、 上記 5, 末端塩基判定工程 、 および、 上記特定塩基含有判定工程にて判定された結果に基づいて、 上記部分 塩基配列作成工程にて作成された上記部分塩基配列情報から上記標的遺伝子に特 異的に上記 R N A干渉を生じさせる規定配列情報を選択する規定配列選択工程と を含む塩基配列処理方法をコンピュータに実行させることを特徴とするプロダラ ム。
〔2 4〕 上記 〔2 3〕 に記載されたプロダラ Λを記録したことを特徴とするコ ンピュータ読み取り可能な記録媒体。
〔2 5〕 R N A干渉の標的遺伝子の塩基配列情報を処理する塩基配列処理装置 と、 クライアント装置とをネットワークを介して通信可能に接続された塩基配列 処理システムにおいて、 上記クライアント装置は、 上記標的遺伝子の名称または 上記塩基配列情報を上記塩基配列処理装置に送信する塩基配列送信手段と、 上記 塩基配列処理装置より送信された、 上記標的遺伝子に特異的に上記 R N A干渉を 生じさせる'規定配列情報を取得する規定配列取得手段とを備え、 上記塩基配列処 理装置は、 上記クライアント装置より送信された上記標的遺伝子の名称に対応す る塩基配列情報または上記クライアント装置より送信された上記塩基酉己列情報を 取得して、 上記塩基配列情報の予め定めた塩基数の配列部位である部分塩基配列 情報を作成する部分塩基配列作成手段と、 上記部分塩基配列作成手段にて作成さ れた上記部分塩基配列情報の 3, 末端の塩基がアデニン、 チミン、 または、 ゥラ シルであるか否かを判定する3, 末端塩基判定手段と、 上記部分塩基配列作成手 段にて作成された上記部分塩基配列情報の 5, 末端の上記塩基がグァニン、 また は、 シトシンであるカゝ否かを判定する 5, 末端塩基判定手段と、 上記部分塩基配 列作成手段にて作成された上記部分塩基配列情報の上記 3, 末端の 7塩基からな る上記塩基配列情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルから なる群より選ばれる 1種または 2種以上の上記塩基がリツチな上記塩基配列情報 である力否かを判定する特定塩基含有判定手段と、 上記 3, 末端塩基判定手段、 上記 5, 末端塩基判定手段、 および、 上記特定塩基含有判定手段にて判定された 結果に基づレヽて、 上記部分塩基配列作成手段にて作成された上記部分塩基配列情 報から上記規定配列情報を選択する規定配列選択手段と、 上記規定配列選択手段 にて選択された上記規定配列情報を上記クライアント装置に送信する規定配列送 信手段とを備えたことを特徴とする塩基配列処理システム。
〔2 6〕 R NA干渉の標的遺伝子の塩基配列情報を取得して、 上記塩基配列情 報の予め定めた塩基数の配列部位である部分塩基配列情報を作成する部分塩基配 列作成工程と、 上記部分塩基配列作成工程にて作成された上記部分塩基配列情報 の 3 ' 末端の塩基がアデユン、 チミン、 または、 ゥラシ であるか否かを判定す る 3, 末端塩基判定工程と、 上記部分塩基配列作成工程にて作成された上記部分 塩基配列情報の 5, 末端の上記塩基がグァニン、 または、 シトシンであるか否か を判定する 5, 末端塩基判定工程と、 上記部分塩基配列作成工程にて作成された 上記部分塩基配列情報の上記 3, 末端の 7塩基からなる上記塩基配列情報が、 上 記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種ま たは 2種以上の上記塩基がリッチな上記塩基配列情報であるカゝ否かを判定する特 定塩基含有判定工程と、 上記 3, 末端塩基判定工程、 上記 5, 末端塩基判定工程 、 および、 上記特定塩基含有判定工程にて判定された結果に基づいて、 上記部分 塩基配列作成工程にて作成された上記部分塩基配列情報から上記標的遺伝子に特 異的に上記 R NA干渉を生じさせる規定配列情報を選択する規定配列選択工程と を含むことを特徴とする塩基配列処理方法。
〔2 7〕 上記部分塩基配列作成工程は、 上記塩基配列情報の上記標的遺伝子の コード領域、 または、 転写領域に対応する部位から、 上記予め定めた上記塩基数 の上記部分塩基配列情報を作成する領域指定塩基配列作成工程をさらに含むこと を特徴とする 〔2 6〕 に記載の塩基配列処理方法。
〔2 8〕 , 上記部分塩基配列作成工程は、 異なる生物に由来する複数の上記塩基 配列情報の間で共通する、 上記予め定めた上記塩基数の上記部分塩基配列情報を 作成する共通塩基配列作成工程をさらに含むことを特徴とする 〔2 6〕 または 〔 2 7〕 に記載の塩基配列処理方法。
〔2 9〕 上記リツチな上記塩基配列情報は、 上記 7塩基からなる上記塩基配列 情報が、 上記アデニン、 上記チ.ミン、'および、 上記ゥラシルからなる群より選ば れる 1種または 2種以上の上記塩基が少なくとも 3塩基以上含まれる上記塩基配 列情報であることを特徴とする 〔2 6〕 から 〔2 8〕 のいずれ力一つに記載の塩 基配列処理方法。
〔3 0〕 上記予め定めた上記塩基数は、 1 3〜 2 8であることを特徴とする 〔 2 6〕 か 〔2 9〕 のいずれか一つに記載の塩基配列処理方法。
〔3 1〕 上記部分塩基配列作成工程は、 オーバーハング部位を含む上記部分塩 基配列情報を作成するオーバーハング部位含有塩基配列作成工程をさらに含むこ とを特徴とする 〔2 6〕 力 ら 〔3 0〕 のいずれ力一つに記載の塩基配列処理方法
〔3 2〕 上記規定配列情報の少なくとも一方の末端に上記オーバーハング部位 を付加するオーバーハング部位付加工程を含むことを特徴とする 〔2 6〕 から 〔 3 0〕 のいずれか一つに記載の塩基配列処理方法。
〔3 3〕 上記オーバーハング部位の塩基数は、 2であることを特徴とする '〔 3 1〕 または 〔3 2〕 に記載の塩基配列処理方法。
[ 3 4 ] 上記規定配列情報と同一または類似の上記塩基配列情報を他の上記塩 基配列情報から検索する同一類似塩基配列検索工程と、 上記同一類似塩基配列検 索工程にて検索された上記同一または上記類似の上記塩基配列情報に基づいて、 上記規定配列情報が上記標的遺伝子とは無関係の遺伝子を標的にするカゝ否かを評 価する無関係遺伝子標的評価工程とを含むことを特徴とする 〔2 6〕 から 〔3 3 〕 のいずれか一つに記載の塩基配列処理方法。
〔3 5〕 上記無関係遺伝子標的評価工程は、 上記同一類似塩基配列検索工程に て検索された上記同一または上記類似の上記塩基配列情報のうち上記標的遺伝子 とは無関係の上記遺伝子の上記塩基配列情報の総数、 および、 上記標的遺伝子と は無関係の上記遺伝子の上記塩基配列情報に付された同一類似の度合いを示す値 に基づいて、 上記同一類似の度合いを示す値の逆数の総和を算出する総和算出ェ 程と、 上記総和算出工程にて算出された上記総和に基づレ、て、 上記規定配列情報 が上記標的遺伝子とは無関係の上記遺伝子を標的にする力否かを評価する総和基 準標的評価工程とをさらに含むことを特徴とする 〔3 4〕 に記載の塩基配列処理 方法。
〔3 6〕 上記部分塩基配列作成工程は、 上記塩基配列情報の上記標的遺伝子の コード領域、 または、 転写領域に対応する部位から、 上記予め定めた上記塩基数 の上記部分塩基配列情報を作成する領域指定塩基配列作成工程をさらに含むこと を特徴とする 〔2 3〕 に記載のプログラム。
〔3 7〕 上記部分塩基配列作成工程は、 異なる生物に由来する複数の上記塩基 配列情報の間で共通する、 上記予め定めた上記塩基数の上記部分塩基配列情報を 作成する共通塩基配列作成工程をさらに含むことを特徴とする'〔2 3〕 または 〔 3 6〕 に記載のプロ.グラム。
〔3 8〕 上記リツチな上記塩基配列情報は、 上記 7塩基からなる上記塩基配列 情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ば れる 1種または 2種以上の上記塩基が少なくとも 3塩基以上含まれる上記塩基配 列情報であること'を特|¾とする 〔2 3〕 、 〔3 6〕 、 〔3 7〕 のいずれか一つに 記載のプログラム。
〔3 9〕 上記予め定めた上記塩基数は、 1 3〜 2 8であることを特徴とする 〔 2 3〕 、 〔3 6〕 、 〔3 7〕 、 〔3 8〕 のいずれか一つに記載のプログラム。 〔4 0〕 上記部分塩基配列作成工程は、 オーバーハング部位を含む上記部分塩 基配列情報を作成するオーバーハング部位含有塩基配列作成工程をさらに含むこ とを特 ί敷とする 〔2 3〕 、 〔3 6〕 、 〔3 7〕 、 〔3 8〕 、 〔3 9〕 のいずれか —つに記載のプログラム。
〔4 1〕 上記規定配列情報の少なくとも一方の末端に上記オーバーハング部位 を付加するオーバーハング部位付加工程を含むことを特徴とする 〔2 3〕 、 〔3 6〕 、 〔3 7〕 、 〔3 8〕 、 〔3 9〕 のいずれか一つに記載のプログラム。
〔4 2〕 上記オーバ一ハング部位の塩基数は、 2であることを特徴とする 〔4 0〕 または 〔4 1〕 に記載のプログラム。
〔4 3〕 上記規定配列情報と同一または類似の上記塩基配列情報を他の上記塩 基配列情報から検索する同一類似塩基配列検索工程と、 上記同一類似塩基配列検 索工程にて検索された上記同一または上記類似の上記塩基配列情報に基づいて、 上記規定配列情報が上曾己標的遺伝子とは無関係の遺伝子を標的にする力、否かを評 価する無関係遺伝子標的評価工程とを含むことを特徴とする 〔2 3〕 、 〔3 6〕 、 〔3 7〕 、 〔3 8〕 、 〔3 9〕 、 〔4 0〕 、 〔4 1〕 、 〔4 2〕 のいずれか一 つに記載のプログラム。
〔4 4〕 上記無関係遺伝子標的評価工程は、 上記同一類似塩基配列検索工程に て検索された上記同一または上記類似の上記塩基配列情報のうち上記標的遺伝子 とは無関係の上記遺伝子の上記塩基配列情報の総数、 および、 上記標的遺伝子と は無関係の上記遺伝子の上記塩基配列情報に付された同一類似の度合いを示す値 に基づいて、 上記同一類似の度合いを示す値の逆数の総和を算出する総和算出ェ 程と、 上記総和算出工程にて算出された上記総和に基づいて、 上記規定配列情報 が上記標的遺伝子とは無関係の上記遺伝子を標的にする力否かを評価する総和基 準標的評価工程とをさらに含むことを特徴とする 〔4 3〕 に記載のプログラム。 〔4 5〕 上記 〔2 3〕 、 〔3 6〕 から 〔4 4〕 のいずれか一つに記載されたプ 口グラムを記録したことを特徴とするコンビゴータ読み取り可能な記録媒体。
〔4 6〕 上記塩基配列処理装置において、 上記部分塩基配列作成手段は、 上記 塩基配列情報の上記標的遺伝子のコード領域、 または、 転写領域に対応する部位 から、 上記予め定めた上記塩基数の上記部分塩基配列情報を作成する領域指定塩 基配列作成手段をさらに備えたことを特徴とする 〔2 5〕 に記載の塩基配列処理 システム。 .
〔4 7〕 上記塩基配列処理装置において、 上記部分塩基配列作成手段は、 異な る生物に由来する複数の上記塩基配列情報の間で共通する、 上記予め定めた上記 塩基数の上記部分塩基配列情報を作成する共通塩基配列作成手段をさらに備えた ことを特徴とする 〔2 5〕 または 〔4 6〕 に記載の塩基配列処理システム。
〔4 8〕 上記塩基配列処理装置において、 上記リツチな上記塩基配列情報は、 上記 7塩基からなる上記塩基配列情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種または 2種以上の上記塩基が少なくと も 3塩基以上含まれる上記塩基配列情報であることを特徴とする, 〔2 5〕 、 〔4 6〕 、 〔4 7〕 のいずれか一つに記載の塩基配列処理システム。
〔4 9〕 上記塩基配列処理装置において、 上記予め定めた上記塩基数は、 1 3 〜2 8であることを特徴とする 〔2 5〕 、 〔4 6〕 、 〔4 7〕 、 〔4 8〕 のいず れか一つに記載の塩基配列処理システム。
〔5 0〕 上記塩基配列処理装置において、 上記部分塩基配列作成手段は、 ォー バーハング部位を含む上記部分塩基配列情報を作成するオーバーハング部位含有 塩基配列作成手段をさらに備えたことを特徴とする 〔2 5〕 、 〔4 6〕 、 〔4 7 J , 〔4 8〕 、 〔4 9〕 のいずれか一つに記載の塩基配列処理システム。
〔5 1〕 上記塩基配列処理装置は、 上記規定配列情報の少なくとも一方の末端 に上記オーバーハング部位を付加するオーバーハング部位付加手段を備えたこと を特徴とする 〔2 5〕 、 〔4 6〕 、 〔4 7〕 、 〔4 8〕 、 〔4 9〕 のいずれか一 つに記載の塩基配列処理システム。
〔5 2〕 上記塩基配列処理装置において、 上記オーバーハング部位の塩基数は 、 2であることを特徴とする 〔5 0〕 または 〔5 1〕 に記載の塩基配列処理シス テム。 ■ .
〔5 3〕 上記塩基配列処理装置は、 上記規定配列情報と同一または類似の上記 塩基配列情報を他の上記塩基配列情報から検索する同一類似塩基配列検索手段と 、 上記同一類似塩基配列検索手段にて検索された上記同一または上記類似の上記 塩基配列情報に基づレ、て、 上記規定配列情報が上記標的遺伝子とは無関係の遺伝 子を標的にするか否かを評価する無関係遺伝子標的評価手段とを備えたことを特 徴とする 〔2 5〕 、 〔4 6〕 、 〔4 7〕 、 〔4 8〕 、 〔4 9〕 、 〔5 0〕 、 〔5 1〕 、 〔5 2〕 のいずれ力一つに記載の塩基配列処理システム。
〔5 4〕 上記塩基配列処理装置において、 上記無関係遺伝子標的評価手段は、 上記同一類似塩基配列検索手段にて検索された上記同一または上記類似の上記塩 基配列情報のうち上記標的遺伝子とは無関係の上記遺伝子の上記塩基配列情報の 総数、 および、 上記標的遺伝子とは無関係の上記遺伝子の上記塩基配列情報に付 された同一類似の度合いを示す値に基づいて、 上記同一類似の度合いを示す値の 逆数の総和を算出する総和算出手段と、 上記総和算出手段にて算出された上記総 和に基づいて、 上記規定配列情報が上記標的遺伝子とは無関係の上記遺伝子を標 的にする力否かを評価する総和基準標的評価手段とをさらに備えたことを特徴と する 〔5 3〕 に記載の塩基配列処理システム。 図面の簡単な説明
第 1図は、 ヒトとマウスとで共通配列である s i RNAの設計を示す図であり 、 第 2図は、 RNAi効果を示す s i RNAの規則性を示す図であり、 第 3図は 、 ヒ ト FBP 1およびマウス Fb p lの塩基配列中の規定配列を有する共通部位 (太字部分) を示す図であり、 第 4図は、 ヒト FBP1およびマウス Fb p 1に 共通の規定配列を列挙した図であり、 第 5図は、 ヒト FBP 1およびマウス F b p 1に共通の規定配列にスコアを付した図であり、 第 6図は、 標的以外の遺伝子 をノックアウトしないよう、 規定配列のうちの 1つを BLAST検索した結果を 示す図であり、 第 7図は、 標的以外の遺伝子をノックアウトしないよう、 規定配 列のうちの 1つを BLAST検索した結果を示す図であり、 第 8図は、 プロダラ ムの出力結果を示す図であり、 第 9図は、 RN A断片の設計 (a〜p) を示す図 であり、 第 10図は、 a〜pの s i RNAが RNA i効果を示す力試験した結果 を示す図であり、 「B」 はショウジヨウバエ培養細胞における結果を、 「C」 は ヒト培養細胞における結果を示す図であり、 第 11図は、 a〜!)の s i RNAの 配列の特徴を分析した結果を示す図であり、 第 12図は、 本発明の基本原理を示 す原理構成図であり、 第 13図は、 本発明が適用される本システムの塩基配列処 理装置 100の構成の一例を示すプロック図であり、 第 14図は、 標的遺伝子塩 基配列フアイ.ル 106 aに格納される情報の一例を示す図であり、 第 15図は、 部分塩基配列ファイル 106 bに格納される情報の一例を示す図であり、 第 16 図は、 判定結果ファイル 106 cに格納される情報の一例を示す図であり、 第 1 7図は、 規定配列ファイル 106 dに格納される情報の一例を示す図であり、 第 18図は、 参照配列データベース 106 eに格納される情報の一例を示す図であ り、 第 19図は、 同一類似度ファイル 106 f に格納される情報の一例を示す図 であり、 第 20図は、 評価結果ファイル 106 gに格納される情報の一例を示す 図であり、 第 21図は、 本発明が適用される本システムの部分塩基配列作成部 1 02 aの構成の一例を示すブロック図であり、 第 22図は、 本発明が適用される 本システムの無関係遺伝子標的評価部 102 hの構成の一例を示すプロック図で あり、 第 2 3図は、 本実 形態における本システムのメイン処理の一例を示すフ ローチャートであり、 第 2 4図は、 本実施形態における本システムの無関係遺伝 子標的評価処理の一例を示すフ口一チヤ一トであり、 第 2 5図は、 標的発現^ ク ター p T RE Cの構造を示す図であり、 第 2 6図は、 実施例 2の 2. ( 2 ) にお けるプライマーの一方がィントロンを挟む形でデザインされていない場合の P C Rの結果を示す図であり、 第 2 7図は、 実施例 2の 2. ( 2 ) におけるプライマ 一の一方がィントロンを挟む形でデザインされている場合の P C Rの結果を示す 図であり、 第 2 8図は、 siRNA; siVIM35の配列おょぴ構造を示す図であり、 第 2 9図は、 siR A; siVIM812の配列および構造を示す図であり、 第 3 0図は、 siRNA; siControlの配列および構造を示す図であり、 第 3 1図は、 siVIM812お よび siVIM35の RNAi活性をアツセィした結果を示す図である。 第 3 2図は、 siControl, siVIM812および siVIM35のビメンチンに対する RNAi活性を示す図 であり、 第 3 3図は、 抗体染色の結果を示す図であり、 第 3 4図は、 プログラム により設計された s i R N Aのルシフェラーゼ遺伝子に対する R NA i活性の測 定結果を示す図であり、 第 3 5図は、 プログラムにより設計された s i R NAの S AR Sウィルスが有する配列に対する RNA i活性の測定結果を示す図である
発明を実施するための最良の形態
本発明の実施の形態を、 以下の < 1 >から< 7 >順に従って説明する。
< 1〉R N A干渉の標的塩基配列検索方法
く 2〉RNA干渉を生じさせるポリヌクレオチドの塩基配列設計方法
< 3 > 2本鎖ポリヌクレオチドの作製方法
< 4 >遺伝子の発現抑制方法
< 5 > s i R NA配列設計プログラム
< 6 > s i R N A配列設計ビジネスモデノレシステム
< 7 > s i RNA配列設計プログラムを実行する塩基配列処理装置等 く 1 >RN A干渉の標的塩基配列検索方法
本発明の検索方法は、 標的とする遺伝子の塩基配列中から、 RN A干渉の起因 となる塩基配列を探し出す方法である。 具体的には、 本発明の検索方法では、 R NA干渉の標的遺伝子の塩基配列から、 下記 (a) から (d) の規則に従う配列 部位を検索する。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3, 末端の 7塩基の配列において、 アデニン、'チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。 「標的遺伝子」 における 「遺伝子」 とは、 遺伝情報をコードする媒体のことい う。 「遺伝子」 は DNA、 RNA、 DN Aおよび RNAの複合体など遺伝情報を コ一ドする物質により構成されるが、 遺伝情報としては物質そのものではなく塩 基配列を電子データ化したものをコンピュータ上などで扱うことが可能である。 「標的遺伝子」 は、 1つのコード領域としてもよいし、 複数のコ一ド領域に渡り 標的としてもよいし、 また、 配列が判明したすべてのポリヌクレオチドを標的と してもよい。 特定の機能を有する遺伝子について検索したい場合には、 その特定 遺伝子のみを標的とすることにより、 当該特定遺伝子に特異的に RN A干渉を生 じさせる塩基配列を効率よく検索する,ことができる。 すなわち、 RNA干渉は m RNAを干渉破壊する現象として知られており、 特定のコード領域を選択するこ とにより検索負荷を軽減できる。 また、 転写領域のひとまとまりを標的遺伝子と して検索してもよい。 なお、 本明細書において塩基配列は特に断らない限りセン ス鎖、 すなわち、 mRN Aの配列を基準として示す。 また、 本明細書中では上記 (a) から (d) の規則を満たす塩基配列のこ,どを 「規定配列」 という。 上記規 則においては、 塩基配列が DN Aの配列であればチミンが、 RNAの配列であれ ばゥラシルが対応する。
規則 (c) は、 3, 末端近傍の配列にアデニン、 チミン、 およぴゥラシルから なる群より選ばれる塩基がリッチに含まれていることを規定しており、 具体的に 検索を^う際の一指標として 3 ' 末端部から 7塩基の範囲内において、 アデニン 、 チミン、 およぴゥラシルから選ばれる塩基がリツチな配列であることを規定し ている。
規則 (c ) において、 「リッチな配列」 とは特定の塩基が現れる頻度が高いこ とを意味し、 割合を概略的に示すと、 規定配列における 3 ' 末端側の 5〜1 0塩 基、 好ましくは 7塩基の配列中にアデニン、 チミンおょぴゥラシルからなる群よ り選ばれる 1種または 2種以上が、 少なくとも 4 0 %以上、 より好ましくは 5 0 %以上含まれることを意味する。 より具体的には、 例えば約 1 9塩基程度の規定 配列の場合を例に挙げると、 3 ' 末端側の 7塩基のうち好ましくは少なくとも 3 塩基以上、 より好ましくは 4塩基以上、 特に好ましくは 5塩基以上が、 アデニン 、 チミンおょぴゥラシルからなる群より選ばれる 1種または 2種以上である。 規則 ( c ) に該当する力否かを確認する手段は特に制限はなく、 7塩基中の好 ましくは 3塩基以上、 より好ましくは 4塩基以上、 特に好ましくは 5塩基以上が アデニン、 チミンまたはゥラシルであることを確認できればよい。 例えば、 アデ ニン、 チミンおよびゥラシルからなる群より選ばれる 1種または 2種以上が、 3 ' 末端側の 7塩基の配列中に 3つ以上含まれることをリツチであると定義した場 合を例として説明すると、 3 ' 末端の第 1番目の塩基から逐次上記 3種の塩基の いずれかであるか照合し、 第 7番目の塩基に至るまでに 3つ現れた場合に、 規則 ( c ) に適合すると判断することができる。 例えば、 第 3番目までに 3つ現れれ ば、 3つの塩基を調べれば足りる。 すなわち、 規則 (c ) について検索する場合 、 必ずしも 3 ' 末端側の 7塩基についてすべて照合することは要しない。 逆に第 7番目までに 3つ以上現れなければリッチではなく、 規則 ( c ) を満たさないと 判断される。
二本鎖ポリヌクレオチドにおいてはアデニンとチミンまたはゥラシルとが相補 的に水素結合することは周知である。 また、 グァニンとシトシンとの相補的な水 素結合 (G— C水素結合)' においては 3つの水素結合部位が形成されるのに対し 、 アデニンとチミンまたはゥラシルとの相補的水素結合 (A_ (T/U) 水素結 合) においては 2つの水素結合部位からなり、 一般的に言って G—C水素結合に 対し、 A— (T/U) 水素結合のほうが結合力は弱い。
規則 (d) においては、 検索する塩基配列の塩基数を規定している。 検索する 塩基配列の塩基数は、 RN A干渉を生じさせ得る塩基数である。 また、 生物の種 類などの条件により、 塩基数があまりに大きすぎる s i RNAでは細胞毒性を生 じてしまうことが知られている。 塩基数の上限は、 RNA干渉を生じさせようと する生物の種類などにより異なるが、 s i RN Aを構成する一本鎖の塩基数はい ずれの種にせよ 30以下であることが好ましい。 また、 哺乳動物の塩基数にあつ ては、 好ましくは 24以下、 より好ましくは 22以下である。 また、'下限は RN A干渉を生じさせる限りにおいて特に制限されるものではないが、 好ましくは 1 5以上、 より好ましくは 1 8以上、 さらに好ましくは 20以上である。 s i RN Aを構成する一本鎖としての塩基数は、 '21で検索することが特に好ましい。 なお、 下記にても説明するが、 s i RNAには、 規定配列の 3' 末端にオーバ 一ハング部が設けられる。 オーバーハング部は塩基数 2であることが好適である 。 したがって、 オーバーハング部を含めず、 規定配列のみの塩基数の上限として は、 好ましくは 28以下、 より好ましくは 22以下、 さらに好ましくは 20以下 であり、 下限としては、 好ましくは 1 3以上、 より好ましくは 1 6以上、 さらに 好ましくは 1 8以上である。 規定配列の最も好ましい塩基数は 1 9である。 AN A iの標的塩基配列の検索は、 オーバーハング部を含める場合おょぴ含めない場 合のいずれで検索してもよい。
規定配列に従う塩基配列は、 RN A干渉を生じさせる確率が極めて高い。 した がって、 本発明の検索方法により、 RNA千渉を生じさせる配列を極めて高い確 率で検索することが可能であり、 RNA干渉を生じさせるポリヌクレオチドの設 計を簡便化することができる。
また、 他の好ましい例として、 規定配列は 7it基以上グァニン (G) および Z またはシトシン (C) が連続した配列を含まない配列であることなどが挙げられ る。 7塩基以上グァニンおよび Zまたはシトシンが連続するというのは、 例えば 、 グァニンまたはシトシンの一方のみが連続する場合と、 グァニンおよびシトシ ンとが混在する配列となっている場合の双方を含み、 より具体的には、 GGGG GGG、 CCCCCCCのほか、 Gおよび Cの混合配列である GCGGCCCな ども含まれる。
なお、 規定配列の検索は、 塩基数を定めた上で上記の (a) から (c) の規則 などに従う部分を検索するようなプログラムを搭載するコンピュータを用いて効 率的に検出可能である。 より具体的な実施の形態は下記く 5 > s i RNA配列設 計プログラム、 および、 く 7 > s i RN A配列設計プログラムを実行する塩基配 列処理装置等の欄に示す。
く 2 > R N A干渉を生じさせるポリヌクレオチドの塩基配列設計方法
' 本発明の塩基配列設計方法は、 上記の検索方法により検索された塩基配列に基 づいて RNA干渉を生じさせるポリヌクレオチド (S i RNA) の塩基配列を設 計するものである。 s i RNAは主として RNAからなるが、 一部に DNAが含 まれている混成ポリヌクレオチドも含まれる。 本発明の塩基配列設計方法では、 上記 (a) 力 ら (d) の規則に従う塩基配列を標的遺伝子の塩基配列から検索し 、 検索された塩基配列と相同な塩基配列を設計する。 また、 他の好ましい設計例 としては、 規定配列は 7塩基以上グァニン (G) および Zまたはシトシン (C) が連続した配列を含まない配列であることなどを考慮してもよい。 (a) 力 ら ( d) の規則および検索の手法などについては、 上記本発明の検索方法について説 明したとおりである。
「相同な配列」 とは、 同一の配列および当該 RN A干渉を生じさせるという機 能を失わない範囲で同一配列に対し欠失、 置換、 挿入などの変異を含む配列のこ とをいう。 標的遺伝子の種類、 配列などの条件にもよるが、 許容される変異を相 同性 (ホモ口ジー) で例示すると、 好ましくは 8 0 %以上、 より好ましくは 9 0 %以上、 さらに好ましくは 9 5 %以上である。 許容される変異の程度としての相 同性を算出する場合、 同一の検索アルゴリズム用いて算出された数値どうしを比 較することが望ましい。 検索アルゴリズムは特に限定されないが、 局所的な配列 の検索に適したものが好適であり、 より具体的には B LAST、 s s e a r c h などを好適に用いることができる。 上記のように、 検索された配列は若干の改変が許容されるが、 設計される塩基 配列の塩基数は、 検索された配列と同一とすることが特に好ましい。 塩基数を同 一とした場合について改変の許容度を例示すると、 設計される塩基配列の塩基が 、 好ましくは 8 0 %以上、 より好ましくは 9 0 %以上、 特に好ましくは 9 5 %以 上検索された配列と一致することが好適である。 例えば、 塩基数 1 9の塩基配列 を設計する場合であれば、 好ましくは 1 6塩基以上、 より好ましくは 1 8塩基以 上が、 検索された塩基配列と一致することが好ましい。 また、 検索された塩基配 列と相同な配列を設計する場合、 検索された塩基配列の 3, 末端の塩基と設計さ れる塩基配列の 3, 末端の塩基とは同一であることが望ましく、 また、 検索され た塩基配列の 5, 末端の塩基と設計される塩基配列の 5, 末端の塩基とが同一で あることが望ましい。
通常 s i R NA分子には、 オーバーハング部が設けられる。 オーバーハング部 とは、 2本鎖の s i R NA分子において、 各鎖の 3, 末端に設けられた、 一本鎖 の状態で突出した部分である。 オーバーハング部は、 生物の種類などにもよるが 、 塩基数は 2が特に好適である。 オーバーハング部の塩基配列は、 基本的には任 意であるが、 検索元の標的遺伝子と同一の塩基配列、 T T、 あるいは UUなどが 好適に用いられる場合がある。 上記のように検索された塩基配列と相同な配列と なるように設計された規定配列の 3, 末端に、 オーバーハング部を設けることに より、 s i R NAを構成するセンス鎖が設計される。
また、 最初から規定配列およびオーバーハング部を含めて検索を行い、 設計す ることもできる。 オーバーハング部の好ましい塩基数は 2である。 したがって、 例えば、 塩基数 1 9の規定配列およぴ塩基数 2のオーバーハング部からなる s i R NAを構成する一本鎖の設計をする場合には、 オーバーハング部を含めた s i .R NAの塩基数としては塩基数 2 1の配列を標的遺伝子から検索すればよく、 ま た 2本鎖の状態について検索する場合には、 塩基数 2 3の配列を検索してもよい 本発明の塩基配列設計方法では、 上記のように所望の標的遺伝子から所定の配 列を検索してくるが、 R NA干渉を生じさせようとする対象は、 標的遺伝子の由 来と必ずしも一致せずともよく、 類縁種などに適用可能である。 例えば、 第 1の 種から単離された遺伝子を標的遺伝子とし、 第 1の種の類縁種である第 2の種に 用いる s i R NAを設計することもできる。 さらに、 例えば複数種の哺乳類から 共通配列を検索し、 この共通配列から上記規定配列を検索して設計することによ り、 哺乳類に幅広く適用可能な s i R NAの設計が可能である。 複数の哺乳類に 共通する配列は、 他の哺乳類においても保存されている確率が高いと考えられる ためである。
標的遺伝子と関係のない遺伝子についてまで R NA干渉を生じさせないように するためには、 設計した配列と同一または類似の配列が他の遺伝子に含まれてい なレ、か検索することが好まし!/、。 設計した配列と同一または類似の配列の検索は 、 一般的なホモロジ一検索を行うことができるソフトウェア等を用いて行えばよ い。 このような同一 z類似配列を除外することにより、 標的とする遺伝子のみに 特異的に R N A干渉を生じさせる配列を設計することができる。
本発明の設計方法により、 R N A干渉を生じさせる R N A分子を、 高い確率で しかも容易に設計することができる。 R NAの合成は、 未だ労力、 時間、 費用を 要するが、 本発明の設計方法によりそれらを大幅に軽減することが可能である。
< 3〉 2本鎖ポリヌクレオチドの作製方法
本発明の 2本鎖ポリヌクレオチドの作製方法は、 R NA干渉を生じさせる確率 の高レヽ 2本鎖ポリヌクレオチドを作製する方法である。 本発明の 2本鎖ポリヌク レオチドは、 ポリヌクレオチドの塩基配列が上記本発明の塩基配列設計方法に従 つて設計され、 その配列設計に従うように 2本鎖ポリヌクレオチドが合成される
。 配列の設計における好ましい形態は、 上記塩基配列設計方法についての説明と 同様である。
2本鎖ポリヌクレオチドは R N A干渉を生じさせる 2本鎖ポリヌクレオチドを 合成するものであり、 このような 2本鎖ポリヌクレオチドとして s i R NAが知 られている。 なお、 本発明の製造法により製造される 2本鎖ポリヌクレオチドは R NAにより構成されることが好ましいが、 一部に D NAを含む混成ポリヌクレ ォチドであってもよい。 本明細書では一部に D NAを含むものも s i R NAの概 200
22 念に含める。 また、 本発明者らの研究によれば、 s i RNAは構造 '機能的にァ シンメトリー性 (非対称性) を有する傾向が認められ、 RN A干渉を生じさせる という目的からすると、 センス鎖の 5, 末端側の半分、 アンチセンス鎖の 3, 末 端側の半分は RNAで構成されることが望ましい。
2本鎖ポリヌクレオチドは、 一方の鎖が標的遺伝子の塩基配列中に含まれる、
(a) 力 ら (d) の規則に従う規定配列と相同な塩基配列の 3, 末端にオーバー ハング部を設けて形成され、 他方の鎖が、 前記規定配列と相同な塩基配列と相補 的な配列の 3, 末端にオーバーハング部を設けて形成される。 各鎖の塩基数はォ '一バーハング部を含め 18〜 24であり、 より好ましくは 20〜22、 特に好ま しくは 21である。 また、 オーバーハ;/グ部の塩基数は 2であることが好ましい 。 全体の塩基数が 21、 そのうちオーバーハング部が塩基数 2で構成される s i RNAは、 哺乳類でも細胞毒性を生じさせずに高確率で RNA干渉を生じさせる s i RNAとして好適である。
RNAの合成は、 例えば、 化学合成によって合成してもよいし、 また、 通常の バイオテクノロジー等の手法に従って行うこともでき、 所定の配列を有する DN A鎖を作製し、 これを鎵型として転写酵素を用いて一本鎖 RNAを合成し、 一本 鎖 RN Aを 2本鎖化するなどの手法により合成することができる。
なお、 分子生物学的な基本的手法については、 BAS I C METHODS I N MOLECULAR B I OLOGY (1986) ; S amb r o o kら MOLECULAR CLON I NG : A LABORATORY MANU Aレ 第 2版、 Co l d Sp r i ng Ha r b o r La b o r a t o r y P r e s s、 Co l d S p r i n g Ha r b o r, N. Y. (1989) 、 細胞工学ハンドブック、 黒木登志夫ら編、 羊土社 (1992) 、 新遺伝子工学ハ ンドブック改訂第 3版、 村松ら編、 羊土社 (1999) など、 多くの標準的な実 験マユュアルがある。
上記本発明の製造方法により得られるポリヌクレオチドとして好ましい形態を 示すと、 RN A干渉の標的遺伝子の塩基配列中から前記 (a) から (d) の規則 に従ゔ塩基数 13〜 28の配列部位を検索し、 一方の鎖が、 標的遺伝子の塩基配 列中に含まれる、 前記 ( a ) 力 ら ( d ) の規則に従う規定配列と相同な塩基配列 の 3, 末端にオーバーハング部を設けて形成され、 他方の鎖が、 前記規定配列と 相同な塩基配列と相捕的な配列の 3, 末端にオーバーハング部を設けて形成され 、 各鎖の塩基数が 1 5〜 3 0であるように合成された、 2本鎖ポリヌクレオチド 力例示される。 当該ポリヌクレオチドは、 R NA干渉を生じさせる確率の高いポ リヌクレオチドである。
また、 s i R NAを発現するような発現べクタ一を調製することもできる。 規 定配列を含む配列を発現するベクターを、 発現が行われ得る無細胞系または細胞 系の条件下におくことで、 発現ベクターを用いて所定の s i R NAを供給するこ とができる。.
従来、 s i R NAの設計は、 試験者の経験や勘に依存していたため、 試行錯誤 を繰り返すことが多かった。 し力、し、 本発明の 2本鎖ポリヌクレオチドの作製方 法により、 R N A干渉を生じさせる 2本鎖ポリヌクレオチドを高い確率で製造す ることが可能である。 上記本発明の検索方法、 配列設計方法またはポリヌクレオ チドの作製方法によれば、 R N A干渉を利用した各種の試験や製造等に要する労 力、 時間、 コストを大幅に削減することが可能である。 すなわち、 本発明は、 遺 伝子解析、 創薬ターゲットの探索、 創薬、 遺伝子治療、 生物種間の差の研究など の R N A干渉を利用する様々な試験、 研究、 開発、 製造等を大幅に簡便にし、 効 率の向上を図ることができる。
く 4〉遺伝子の発現抑制方法
本発明の遺伝子発現抑制方法は、 所定の塩基配列を検索する工程と、 検索され た塩基配列に基づいて s i R N Aの塩基配列を設計して合成する工程と、 得られ た s i R NAを標的遺伝子を含む発現系に導入する工程とを含む。
' 所定の塩基配列を検索する工程は、 上記 R N A干渉め標的塩基配列検索方法に 従う。 好ましい態様も上記の通りである。 また、 検索された塩基配列に基づいて s i R NAの塩基配列を設計して合成する工程は、 上記、 R NA干渉を生じさせ るポリヌクレオチドの塩基配列設計方法、 2本鎖ポリヌクレオチドの作製方法に 従って行うことができ、 好ましい形態も同様である。 得られた 2本鎖ポリヌクレオチドは、 標的遺伝子の発現系に添加して標的遺伝 子の発現を抑制する。 標的遺伝子の 現系とは、 標的遺伝子が発現している体系 のことであり、 より具体的には、 少なくとも標的遺伝子の mR NAが形成される 反応系を備える系である。 標的遺伝子の発現系としては、 I n V i t r o、 I n v i v oのいずれも含まれる。 標的遺伝子の発現系として、 培養細胞、 培養 組織、 生体などのほか、 無細胞系で用いることも可能である。 発現抑制をしょう とする標的遺伝子 (抑制標的遺伝子) は必ずしも検索された配列の由来と一致す る生物種のものに限らずともよいが、 検索対象遺伝子と抑制対象遺伝子の由来が 近縁であればあるほど、 特異的かつ効果的に特定遺伝子の抑制を行うことができ る。
標的遺伝子の発現系に導入するとは、 標的遺伝子の発現反応系の中に取り込ま せるということである。 具体的に例を挙げると、 標的遺伝子を有する培養細胞に 2本鎖ポリヌクレオチドをトランスフエタトし、 細胞内に取り込ませる、 規定配 列おょぴオーバーハング部からなる塩基配列を有する発現べクターを作製し、 標 的遺伝子を有する細胞内に導入するなどの手法が挙げられる。
本発明の遺伝子抑制方法によれば、 効率よく R N A干渉を生じさせるポリヌク レオチドを得られるた 、 効率よく、 また簡便に遺伝子を抑制することが可能で ある。
< 5 > s i R NA配列設計プログラム
以下、 s i R N A配列設計プログラムの実施形態例を説明する。
( 5 - 1 ) プログラムの概要
本プログラムは、 ゲノムのシークェンスが進んでいない種、 たとえばゥマ、 ブ タなどに対して R NA干渉を行う際に、 既に公開されているヒトとマウスのホモ 口グの配列情報をもとに、 目的の種で使用可能な s i R N Aの配列を計算するも のである。 本プログラムで s i R NAを設計すれば、 標的遺伝子をシークェンス することなく迅速に R NA千渉を行うことができる。 s i R NAの設計 (計算) にあたっては、 Gまたは C配分の規則 (上記 (a ) 〜 (d ) で示される規則) を 考慮して R NA i活性を有する確率が高い配列を選ぶとともに、.標的遺伝子とは 無関係の遺伝子に対して R N A干渉が起こらないようホモロジ一サーチによるチ エックを行っている。 なお、 本明細書において 「Gまたは C」 を 「GZC」 と、 「Aまたは T」 を 「ΑΖΤ」 とそれぞれ表記する場合がある。 また、 「Α/Τ ( U) 」 とは、 デォキシリボ核酸による配列の場合 Τ (チミン) であり、 リボ核酸 による配列の場合 U (ゥラシル) であることを示す。
(5- 2) s i RN A設計の方針
ヒトの遺伝子 Xおよび、 そのホモログであるマウスの遺伝子 Xの配列が既知で あるとする。 本プログラムはそれらの配列を読み込み、 コ一ド領域 (CDS) 部 分から 23·塩基以上の完全に共通な配列を探し出す。 この共通部分から s i RN Aを設計すれば、 その s i RNAはヒトとマウスの遺伝子 Xをともに標的とする ことができる (第 1図) 。 . ヒトとマウスとで完全に共通な部分は、 他の哺乳類でも保存されている確率が 高いと考えられるので、 上記め s i RNAはヒトとマウスの遺伝子 Xのみならず 、 他の哺きし類の遺伝子 Xに対しても機能することが期待される。 つまり、 標的遺 伝子の配列が未知の動物種であっても、 対応するヒトとマウスのホモログについ て配列情報が既知であれば、 本プログラムを用いて s i RNAを設計することが できる。
なお、 .哺乳類においては、 実際に機能する s i RNAは配列に規則性があるこ とが判っている (第 2図) 。 '本プログラムでは、 その規則に適合した配列のみを 選ぶようにした。 第 2図は、 R N A i効果を示す s i R N Aの配列の規則性 ( s i RNAの GZC配分の規則) を示す図である。 第 2図において、 2 1塩基の長 さをもつ 2本の RNA鎖が、 それぞれ 3' 側に 2塩基のオーバーハングを持つよ うに 5 ' 側の 1 9塩基どうしで塩基対を形成しているような s i RNAで、 塩基 対を形成している 1 9塩基のうちコーディング側の配列の、 1) 3, 末端が AZ Uであること、 2) 5, 末端が G/Cであること、 '3) 3' 側の 7文字は、 AZ Uの割合が高いこと、 が求められる。 特に、 1) および 2) の条件は重要である
(5— 3) プログラムの構造 本プログラムは 3つの部分から構成されている。 すなわち、 (5— 3— 1) ヒ トとマウスとで共通部位の配列 (部分配列) を検索する部分、 (5-3-2) G ZC配分の規則に基づいて配列にスコアをつける部分、 ( 5— 3— 3) 無関係の 遺伝子を標的にしないようホモロジ一サーチによりチェックする部分、 である。
(5-3-1) 共通配列を検索する部分
複数の塩基配列ファイル (f i l e l, f i 1 e 2, f i l e 3, . . . ) を 読み込み、 全ファイルに共通に出現する 23文字の配列をすベて見いだす。
(計算例)
ί i 1 e 1としてヒトの遺伝子 FBP 1 (NM_000507 : Homo s a l e n s f r u c t o s e— 1, 6— b i s p h o s p h a t a s e 1 ) 、 f i 1 e 2としてマウスの遺伝子 F b 1 (NM— 019395 : Mu s mu s c u 1 u s f r u c t o s e b i s ph o s ph a t a s e 1) の 配列をプログラムに入力した。 その結果、 両者の配列 (第 3図) から両者に共通 23文字の配列 (ヒト FBP 1とマウス Fb p lに共通な配列) が 15個見い だされた (第 4図) 。
(5-3-2) 配列にスコアをつける部分
前述の G/C配分の規則に適合した配列のみを選択するために、 23文字の配 列に対してスコアを付ける。
(方法)
23文字の配列に対して、 以下のようにスコアを付ける。
スコア 1 :先頭から 21文字目が AZU力、。 [n o = 0, y e s = 1] スコア 2 :先頭から 3文字目が G/Cカ [n o = 0, y e s = 1] スコア 3 :先頭から 15文字目から 21文字目までの 7文字のうち、 AZUの 数。 [0 - 7]
総合スコア : スコア 1〜3の積。 ただし積が 3以下の場合は 0とする。
(計算例)
第 4図に示した 15個の配列に対して計算を行った結果を、 第 5図に示す。 第 5図は、 ヒト FBP 1とマウス Fb p lに共通な配列にスコアを付した図である 。 なお、 第 5図に示す配列の後には、 スコア 1、 スコア 2、 スコア 3、 総合スコ ァが順に記載されている。
(5-3-3) 無関係の遺伝子を標的にしないようチ ックする部分 設計した s i RNAが、 標的遺伝子とは無関係の遺伝子に対して機能しないよ う、 公開されているヒト 'マウスの全 mRNAに対してホモロジ一サーチを行い 、 無関係の遺伝子がヒットする度合いを評価する。 ホモロジ一サーチには各種ァ ルゴリズムが使用可能であるが、 ここでは、 BLASTを使用した例を示す。 な お、 BLASTを用いる場合は、 検索配列が 23塩基と短いことを考慮して、 W o r d S i z eを十分に小さくすることが望ましレ、。
B LASTの結果、 E v a l u eが 10. 0以下のヒットのうち、 標的遺伝 子以外の全てのヒットについて、 E V a 1 u eの逆数の総和を求める (以下、 この値をホモロジ一'スコアと呼ぶ)。 すなわち、 ホモロジ一'スコア (X) は 、 下記式により求められる。
Figure imgf000029_0001
all hits
注意点: E v a 1 u eが低いヒットほど、 q u e r yの 23文字とホモロジ 一が高く、 s i RNAの標的とされる危険性が高い。 また、 ヒットの数が多いほ ど、 より多くの無関係な遺伝子を標的にする確率が高い。 この 2点を考慮して、 s i RNAが標的遺伝子と無関係の遺伝子を標的にする危険性を、 上の式を用い て評価している。
(計算例)
23文字の配列に対して、 上記のホモロジ一サーチを行った結果と、 ホモロジ 一 ·スコアを示す (第 6図、 第 7図) 。 なお、 第 6図には、 ヒト FBP 1とマウ ス F b p 1に共通な酉己歹 U 「c a c c c t g a c c c g c t t c g t c a t g g」 を BLASTした結果が示されており、 最初の 2行は、 マウス Fb p lとヒト F BP 1がヒットしたものである。 ホモロジ一'スコアは 5. 9で、 ヒットが少な い例である。 この配列の s i RNAは、 他の遺伝子を標的にする危険性が低い。 また、 第 7図には、 ヒト FBP 1とマウス Fb 1に共通な配列 「g c c t t c t g a g a a g g a t g c t c t g cj を B LA S Tした結果が示されている。 ヒットが多い例で、 ホモロジ一 ·スコアは 170. 8である。 他の遺伝子を標的 にする危険性が高いため、 s i RNAとして適さない。
実際には、 上記の (5— 3— 1) 、 (5-3-2) (5-3-3) の部分は 一体として構成してもよく、 第 3図に示したヒトとマウスの酉己列を入力すると、 第 8図のような出力が直接得られる。 ここで、 第 8図に示す配列の後には、 スコ ァ 1、 スコア 2、 スコア 3、 総合スコア、 および、 ホモロジ一'スコアを 10倍 した値が順に記載されている。 なお、 処理時間短縮のため、 総合スコアが 0の配 列はホモロジ一'スコアを計算しないようにしてもよい。 この結果から、 s i R NAとして 「36 c a c c c t g a c c c g c t t c g t c a t g'gj の音!!分 を使えばよいことがわかる。 また、 (5— 3— 1) 、 (5— 3— 2) 、 (5-3 一 3 ) の部分のうち 1つの機能を単独で利用することもできる。
(5-4) 実際の計算
ヒト ·マウス間のホモログのうち約 6400遺伝子のペアに対して、 実際に本 プログラムで s i RNAの設計をおこなった。 その結果、 約 7割について、 ヒト とマウスとに共通な配列で、 力つ有効な s i RN Aの配列規則性の規則を満たし 、 無関係な遺伝子を標的としないような s i RNAが設計できた。
これらの s i RNAはヒトとマウスのみならず、 多岐の哺乳類で効果的に標的 遺伝子を抑える効果があると期待され、 家畜や愛玩動物などへの応用など産業的 価値が高いと考えられる。 また本プログラムを用い、 同種内の複数の遺伝子、 た とえば e I F 2C 1と e I F 2 C 2を 時に標的とする s.i RNAを設計するこ とも可能であり、 本プログラムが提供する s i RNA設計の手法は、 応用範囲が 広くきわめて強力なものといえる。 さらに、 ヒトとマウスの共通な部分の配列を 用いて P C Rプライマーを設計すれば、 多岐の哺乳類で目的の遺伝子を増幅でき る、 といった利用法もある。 なお、 s i RN A配列設計プログラムを実行する装置の実施の形態は、 下記 < 7>s i RN A配列設計プログラムを実行する塩基配列処理装置等の欄に詳細に 示す。
< 6 > s i.RN A配列設計ビジネスモデルシステム
本発明の s i RNA配列設計ビジネスモデルシステムは、 s i RNA配列設計 プログラムを適用するにあたり、 ゲノムデータベース、 ESTデータベース、 進 化系統樹データベースを本プログラムのロジックに添つて単独で或レヽは組み合わ せて参照し、 遺伝子配列情報の a V a i 1 a b 1 e状態に応じた効果的な s i R N Aを顧客へ提案するというシステムである。 a V a i 1 a b 1 e状態とは、 情 報が利用可能な状態であることをいう。
(1) ゲノム情報が a V a i 1 a b 1 eだが O R Fの特定が困難なものについて は、 EST情報、 等を基にェクソン想定部位に対して効果的な s i RNA候補を 抽出し、 スプライシングバリアントを考慮した s i RN A配列とその評価結果を 表示する。
(2) 遺伝子配列、 遺伝子名が明ら なものは、 遺伝子配列または遺伝子名を入 力後、 効果的な s i RNA候補を抽出し、 s i RN A配列とその評価結果を表示 する。
(3) ゲノム情報が a V a i 1 a 1 eでないものについては、 同種の遺伝子機 能を保存している類緣闋係 (同属、 乃至は起源を同じとする) にある生物種の遺 伝子配列、 或いは進化系統樹的に挟まれた、 ゲノム配列が a V a i 1 a b 1 eな 2種類以上の生物種の遺伝子配列、 を用いて効果的な s i RNA候補を抽出し、 s i RN A配列とその評価結果を表示する。
(4) 感染症の遺伝子機能解析、 創薬ターゲット発掘には、 微生物のゲノムデー タベース .進化系統樹データベースへ更に微生物のアポトーシス誘導部位情報、 機能発現部位情報を組み合わせて網羅的な s i RNA候補配列を求める手法が有 効である。
< 7> s i RNA配列設計プログラムを実行する塩基配列処理装置等 以下、 上述した s i R NA配列設計プログラムを実行する装置である、 本発明 にかかる塩基配列処理装置、 塩基配列処理方法をコンピュータに実行させるプロ グラム、 記録媒体、 および、 塩基配列処理システムの実施の形態を図面に基づい て詳細に説明する。 なお、 この実施の形態によりこの発明が限定されるものでは ない。 .'
[本発明の概要]
以下、 本発明の概要について説明し、 その後、 本発明の構成おょぴ処理等につ 'いて詳細に説明する。 第 1 2図は、 本発明の基本原理を示す原理構成図である。
本発明は、 概略的に、 以下の基本的特徵を有する。 すなわち、 本発明は、 R N A干渉の標的遺伝子の塩基配列情報を取得して、 塩基配列情報の予め定めた塩基 数の配列部位である部分塩基配列情報を作成する (ステップ S— 1 ) 。
ここで、 ステップ S— 1において、 塩基配列情報の標的遺伝子のコード領域、 または、 転写領域に対応する部位から、 予め定めた塩基数の部分塩基配列情報を 作成してもよい。 また、 異なる生物に由来する複数の塩基配列情報 (例えば、 ヒ トの塩基配列情報およびマウスの塩基配列情報など) の間で共通する、 予め定め た塩基数の部分塩基配列情報を作成してもよレヽ。 また、 同じ生物種における類似 する複数の塩基配列情報の間で共通する、 予め定めた塩基数の共通な部分塩基配 列情報を作成してもよい。 また、 異なる生物に由来する複数の塩基配列情報の標 的遺伝子のコード領域、 または、 転写領域に対応する部位から、 予め定めた塩基 数の共通な部分塩基配列情報を作成してもよい。 また、 同じ生物種における類似 する複数の塩基配列情報の標的遺伝子のコード領域、 または、 転写領域に対応す る部位から、 予め定めた塩基数の共通な部分塩基配列情報を作成してもよレ、。 こ れにより'、 標的遺伝子に特異的に R NA干渉を生じさせる規定配列を効率よく選 択することができ、 計算負荷を軽減できる。
さらに、 ステップ S— 1において、 オーバーハング部位を含む部分塩基配列情 報を作成してもよい。 具体的には、 例えば、 オーバーハング部位が含まれている ことを表すオーバーハング部位含有情報が付加された部分塩基配列情報を作成し てもよい。 すなわち、 部分塩基配列情報とオーバーハング部位含有情報とを相互 に関連付けてもよい。 これにより、 最初から規定配列およびオーバーハング部位 を含めて選択を行い、 設計することができるようになる。
なお、 上述の予め定めた塩基数の上限は、 オーバーハング部位を含まない場合 は、 好ましくは 2 8以下、 より好ましくは 2 2以下、 さらに好ましくは 2 0以下 であり、 オーバーハング部位を含む場合は、 好ましくは 3 2以下、 より好ましく は 2 6以下、 さらに好ましくは 2 4以下である。 また、 予め定めた塩基数の下限 は、 オーバーハング部位を含まない場合は、 好ましくは 1 3以上、 より好ましく は 1 6以上、 さらに好ましくは 1 8以上であり、 オーバーハング部位を含む場合 は、 好ましくは 1 7以上、 より好ましくは 2 0以上、 さらに好ましくは 2 2以上 である。 そして、 最も好ましい予め定めた塩基数は、 オーバーハング部位を含ま , ない場合は、 1 9であり、 オーバーハング部位を含む場合は、 2 3である。 これ 'により、 哺季し類においても細胞毒性を生じさせずに R NA干渉を生じさせる規定 配列を効率よく選択することができる。
ついで、 ステップ S— 1にて作成された部分塩基配列情報の 3 ' 末端の塩基が アデニン、 チミン、 'または、 ゥラシルである力否かを判定する (ステップ S— 2 ) 。 なお、 具体的には、 例えば、 3, 末端の塩基がアデニン、 チミン、 または、 ゥラシルであるときには 「1」 を、 そうでないときには 「0」 を判定結果として 出力してもよい。
ついで、 ステップ S—1にて作成された部分塩基配列情報の 5, 末端の塩基が グァニン、 または、 シトシンである力否かを判定する (ステップ S— 3 ) 。 なお 、 具体的には、 例えば、 5, 末端の塩基がグァニン、 または、 シトシンであると きには 「1」 を、 そうでないときには 「0」 を判定結果として出力してもよい。 ついで、 ステップ S— 1にて作成された部分塩基配列情報の 3, 末端の 7塩基 からなる塩基配列情報が、 アデニン、 チミン、 および、 ゥラシルからなる群より 選ばれる 1種または 2種以上の塩基がリツチな塩基配列情報であるか否かを判定 する (ステップ S _ 4 ) 。 なお、 具体的には、 例えば、 部分塩基配列情報の 3 ' 末端の 7塩基からなる塩基配列情報に含まれる、 アデニン、 チミン、 および、 ゥ ラシルからなる群より選ばれる 1種または 2種以上の塩基の数を判定結果として 出力してもよい。 ステップ S— 4における判定の規則は、 ステップ S— 1にて作 成された部分塩基配列情報の 3 ' 末端近傍の塩基配列情報がアデニン、 チミン、 おょぴ、 ゥラシルからなる群より選ばれる 1種または 2種以上の塩基がリッチな 塩基配列情報であることを規定しており、 具体的に検索を行う際の一指標として 3, 末端から 7塩基の範囲内の塩基配列情報がアデ ン、 チミン、 および、 ゥラ シルからなる群より選ばれる 1種または 2種以上の塩基がリッチな塩基配列情報 であることを規定している。
ここで、 ステップ S— 4において、 「リッチな塩基配列情報」 は、 上述のく 1 〉R NA干渉の標的塩基配列検索方法に記述されている 「リッチな配列」 であり 、 具体的には、 例えば、 ステップ S— 1にて作成された部分塩基配列情報が 1 9 塩基程度からなる場合、 当該部分塩基配列情報の 7塩基からなる塩基配列情報が 、 アデェン、 チミン、 および、 ゥラシノレからなる群より選ばれる 1種または 2種 以上の塩基が少なくとも好ましくは 3塩基以上、 より好ましくは 4塩基以上、 特 に好ましくは 5塩基以上含まれる塩基配列情報である。
また、 ステップ S— 2からステップ S— 4において、 オーバーハング部位を含 む部分塩基配列情報を判定する場合、 部分塩基配列情報のオーバーハング部位を 除いた配列部位を判定対象として判定する。
ついで、 ステップ S— 2、 ステップ S— 3、 および、 ステップ S— 4にて判定 された結果に基づいて、 ステップ S— 1にて作成された部分塩基配列情報から標 的遺伝子に特異的に R N A干渉を生じさせる規定配列情報を選択する (ステップ S— 5 ) 。
具体的には、 例えば、 ステップ S— 2にて 3 ' 末端の塩基がアデニン、 チミン 、 または、 ゥラシルであると判定され、 ステップ S— 3にて 5 ' 末端の塩基がグ ァニン、 または、 シトシンであると判定され、 かつ、 ステップ S— 4にて部分塩 基配列情報の 3 ' 末端の 7塩基からなる塩基配列情報が、 アデニン、 チミン、 お よび、 ゥラシルからなる群より選ばれる 1種または 2種以上の塩基がリツチな塩 基配列情報であると判定された部分塩基配列情報を規定配列情報として選択する 。 ここで、 具体的には、 例えば、 ステップ S— 2、 ステップ S— 3、 および、 ス テツプ S— 4にて出力される数値の積を算出し、 当該積の値に基づいて、 ステツ プ S— 1にて作成された部分塩基配列情報から規定配列情報を選択してもよレ、。 これにより、 哺乳類などにおいて、 RNA干渉を生じさせる確率が極めて高い 、 つまり RNA干渉に有効な s i RNAの配列を効率よく、 容易に作成すること ができる。
ここで、 ステップ S— 5にて選択された規定配列情報の少なくとも一方の末端 にオーバーハング部位を付加してもよい。 なお、 例えば、 ターゲット側を検索す る場合は、 規定配列情報の両末端にオーバーハング部位を付加してもよい。 これ により、 R N A干渉を生じさせるポリヌクレオチドの設計を簡便化することがで きる。
なお、 上述のオーバーハング部位の塩基数は、 '上述の <2>RNA干渉を生じ させるポリヌクレオチドの塩基配列設計方法に記述されている塩基数であり、 具 体的には、 例えば、 2が特に好適である。
また、 ステップ S— 5にて選択された規定配列情報と同一または類似の塩基配 列情報を、 他の塩基配列情報 (例えば NCB Iの Re f S e q (R e f e r e n c e S e qu e n c e p r o j e c t) などの公的データベースで公開され ている塩基配列情報) から、 例えば BLAST、 FASTA、 s s e a r c hな どの既存のホモロジ一検索手法を用いて検索し、 検索された同一または類似の塩 基配列情報に基づいて、 規定配列情報が標的遺伝子とは無関係の遺伝子を標的に する力否かを評価してもよい。
具体的には、 例えば、 ステップ S— 5にて選択された規定配列情報と同一また は類似の塩基配列情報を、 他の塩基配列情報 (例えば NCB Iの Re f S e qな どの公的データベースで公開されている塩基配列情報) か 、 例えば BLAST 、 FASTA、 s s e a r c hなどの既存のホモロジ一検索手法を用いて検索し 、 検索された同一または類似の塩基配列情報のうち標的遺伝子とは無関係の遺伝 子の塩基配列情報の総数、 および、 標的遺伝子とは無関係の遺伝子の塩基配列情 報に付された同一類似の度合レヽを示す値 (例えば B L A S T、 F A S T Aおよび s s e a r c hの場合は、 「E v a 1 u e」 ) に基づいて、 同一類似の度合い W
34 を示す値の逆数の総和を算出し、 算出された総和に基づいて (例えば、 算出され た総和の大小などに基づいて) 、'規定配列情報が標的遺伝子とは無関係の遺伝子 を標的にする力否かを評価してもよレ、。
これにより、 規定配列情報から、 標的とする遺伝子のみに特異的に R NA干渉 を生じさせる配列を選出することができる。
以上、 本発明により選択された、 標的遺伝子と関係のない遺伝子についてまで R N A干渉を生じさせない規定配列情報に基づレ、て R N Aの合成を行えば'、 それ にかかる労力、 時間、 費用を従来に比べ大幅に軽減することができる。
[システム構成]
まず、 本システムの構成について説明する。 第 1 3図は、 本発明が適用される ■ 本システムの構成の一例を示すブロック図であり、 該構成のうち本発明に関係す る部分のみを概念的に示している。
本システムは、 概略的に、 R N A干渉の標的遺伝子の塩基配列情報を処理する 塩基配列処理装置 1 0 0と、 配列情報や構造情報等に関する外部データベースや ホモロジ一検索等の外部プログラム等を提供する外部システム 2 0 0とを、 ネッ . トワーク 3 0 0を介して通信可能に接続して構成されている。
第 1 3図において、 ネットワーク 3 0 0は、 塩基配列処理装置 1 0 0と外部シ ステム 2 0 0とを相互に接続する機能を有し、 例えば、 インターネット等である 第 1 3図において、 外部システム 2 0 0は、 ネットワーク 3 0 0を介して、 塩 基配列処理装置 1 0 0と相互に接続され、 利用者に対して配列情報や構造情報等 に関する外部データベースゃホモロジ一検索やモチーフ検索等の外部プログラム を実行するウェブサイトを提供する機能を有する。
ここで、 外部システム 2 0 0は、 WE Bサーバや A S Pサーバ等として構成し てもよく、 そのハードウェア構成は、 一般に市販されるワークステーション、 パ ーソナルコンピュータ等の情報処理装置およびその付属装置により構成してもよ い。 また、 外部システム 2 0 0の各機能は、 外部システム 2 0 0のハードウエア 構成中の C P U、 ディスク装置、 メモリ装置、 入力装置、 出力装置、 通信制御装 置等およびそれらを制御するプログラム等により実現される。
第 1 3図において塩基配列処理装置 1 0 0は、 概略的に、 塩基配列処理装置 1 0 0の全体を統括的に制御する C P U等の制御部 1 0 2、 通信回線等に接続され るルータ等の通信装置 (図示せず) に接続される通信制御インターフェース部 1 0 4、 入力装置 1 1 2や出力装置 1 1 4に接続される入出力制御インターフエ一 ス部 1 0 8、 および、 各種のデータベースやテープノレなどを格納する記憶部 1 0 6を備えて構成されており、 これら各部は任意の通信路を介して通信可能に接続 されている。 さらに、 この塩基配列処理装置 1 0 0は、 ルータ等の通信装置およ ぴ専用線等の有線または無線の通信回線を介して、 ネットワーク 3 0 0に通信可 能に接続されている。
記憶部 1 0 6に格納される各種のデータベースやテーブル (標的遺伝子塩基配 列ファイル 1 0 6 a〜標的遺伝子ァノテーシヨンデータベース 1 0 6 h ) は、 固 定ディスク装置等のストレージ手段であり、 各種処理に用いる各種のプログラム ゃテ一ブノレやフアイルゃデ一タベースゃゥェプぺージ用フアイル等を格納する。 これら記憶部 1 0 6の各構成要素のうち、 標的遺伝子塩基配列ファイル 1 0 6 aは、 R N A干渉の標的遺伝子の塩基配列情報を格納する標的遺伝子塩基配列格 納手段である。 第 1 4図は、 標的遺伝子塩基配列ファイル 1 0 6 aに格納される 情報の一例を示す図である。
標的遺伝子塩基配列ファイル 1 0 6 aに格納される情報は、 第 1 4図に示すよ うに、 R N A干渉の標的遺伝子の塩基配列情報を一意に識別する塩基配列識別情 報 (例えば、 第 1 4図の 「NM一 0 0 0 5 0 7」 ) と、 塩基配列情報 (例えば、 第 1 4図の 「AT G G C T GA ' · · AG T GA」 ) とを相互に関連付けて構成 されている。
また、 部分塩基配列フアイノレ 1 0 6 bは、 R N A干渉の標的遺伝子の塩基配列 情報の予め定めた塩基数の配列部位である部分塩基配列情報を格納する部分塩基 配列格納手段である。 第 1 5図は、 部分塩基配列ファイル 1◦ 6 bに格納される 情報の一例を示す図である。 部分塩基配列ファイル 1 06 bに格納される情報は、 第 1 5図に示すように、 部分塩基配列情報を一意に識別する部分塩基配列識別情報 (例えば、 第 1 5図の 「NM— 000507 -. 36」 ;) 'と、 部分塩基配列情報 (例えば、 第 1 5図の 「 c a c c c t ' . ' t c a t g g」 ) と、 オーバーハング部位が含まれているこ とを表すオーバーハング部位含有情報 (例えば、 第 1 5図の 「含有」 ) とを相互 に関連付けて構成されている。
また、 判定結果ファイル 1 06 cは、 後述する 3, 末端塩基判定部 1 02 b, 5, 末端塩基判定部 102 c、 および、 特定塩基含有判定部 1 02 dにて判定さ れた結果を格納する判定結果手段である。 第 1 6図は、 判定結果ファイル 1 06 cに格納される情報の一例を示す図である。
判定結果ファイル 106 cに格納される情報は、 第 1 6図に示すように、 部分 塩基配列識別情報 (例えば、 第 1 6図の 「NM_000507 : 36」 ) と、 3 , 末端塩基判定部 1 02 bにて判定された結果である 3, 末端塩基判定結果 (例 えば、 第 1 6図の 「1」 ) と、 5, 末端塩基判定部 1 02 cにて判定された結果 である 5, 末端塩基判定結果 (例えば、 第 1 6図の 「1」 ) と、 特定塩基含有判 定部 1 02 dにて判定された結果である特定塩基含有判定結果 (例えば、 第 1 6 図の 「4」 ) と、 3, 末端塩基判定部 1 02 b、 5, 末端塩基判定部 102 c、 および、 特定塩基含有判定部 1 02 dにて判定された結果を総合した結果である 総合判定結果 (例えば、 第 1 6図の 「4」 ) とを相互に関連付けて構成されてい る。
なお、 第 1 6図において、 3, 末端塩基判定結果および 5, 末端塩基判定結果 は、 3, 末端塩基判定部 102 b, 5' 末端塩基判定部 102 cのそれぞれにて 「含む」 と判定された場合 「1」 を設定し、 「含まない」 と判定された場合 「0 」 を設定した場合の一例である。 また、 第 1 6図において、 特定塩基含有判定結 果は、 部分塩基配列情報の 3, 末端の 7塩基からなる塩基配列情報に含まれる、 アデニン、 チミン、 および、 ゥラシルからなる群より選ばれる 1種または 2種以 上の塩基の数を設定した場合の一例である。 さらに、 第 1 6図において、 総合判 定結果は、 3, 末端塩基判定結果、 5, 末端塩基判定結果、 および、 特定塩基含 有判定結果の積を設定した場合の一例である。 なお、 具体的には、 例えば、 当該 積が 3以下の場合は、 「0」 を設定してもよい。
また、 規定配列ファイル 106 dは、 標的遺伝子に特異的に RN A干渉を生じ させる部分塩基配列情報である規定配列情報を格納する規定配列格納手段である 。 第 17図は、 規定配列ファイル 106 dに格納される情報の一例を示す図であ る。
規定配列ファイル 106 dに格納される情報は、 第 17図に示すように、 部分 塩基配列識別情報 (例えば、 第 17図の 「NM一 000507 : 36」 ) と、 標 的遺伝子に特異的に RNA干渉を生じさせる部分塩基配列情報である規定配列情 報 (例えば、 第 17図の 「c a c c c t ' · ' t c a t g g」 ) とを相互に関連 付けて構成されている。
また、 参照配列データベース 106 eは、 後述する同一類似塩基配列検索部 1 02 gにて規定配列情報と同一または類似の塩基配列情報を検索するために参照 する塩基配列情報である参照塩基配列情報を格納するデータベースである。 なお 、 参照配列データベース 106 eは、 インターネットを経由してアクセスする外 部の塩基配列情報データベースであってもよく、 また、 これらのデータベースを コピーしたり、 オリジナルの酉己列情報を格納したり、 さらに独自のァノテーショ ン情幸等を付加したりして作成したインハウスデータベースであってもよい。 第 18図は、 参照配列データベース 106 eに格納される情報の一例を示す図であ る。
参照配列データベース 106- eに格納される情報は、 第 18図に示すように、 参照配列識別情報 (例えば、 第 18図の 「r e f I NM_015820. 1 |」 ) と、 参照塩基配列情報 (例えば、 第 18図の 「c a C C C t ' ' ' g c a t g g」 ) とを相互に関連付けて構成されている。
また、 同一類似度ファイル 106 f は、 後述する同一類似塩基配列検索部 10 2 gにて検索された同一または類似の塩基配列情報に付された同一類似の度合い を示す値である同一類似度を格納する同一類似度格納手段である。 第 19図は、 同一類似度ファイル 106 f に格納される情報の一例を示す図である。 同一類似度フアイノレ 106 f に格納される情報は、 第 19図に示すように、 部 分塩基配列識別情報 (例えば、 第 19図の 「NM— 000507 : 36」 ) と、 参照配列識別情報 (例えば、 第 19図の 「r e f I NM— 015820. 1 门 および 「r e ί I NM一 003837. l |」 ) と、 同一類似度 (例えば、 第 1 9図の 「0. 52」 ) とを相互に関連付けて構成されている。
また、 評価結果ファイル 106 gは、 後述する無関係遺伝子標的評価部 102 hにて標的遺伝子とは無関係の遺伝子を標的にするか否かを評価した結果を格納 する評価結果格納手段である。 第 20図は、 評価結果ファイル 106 gに格納さ れる情報の一例を示す図である。
評価結果ファイル 106 gに格納される情報は、 第 20図に示すように、 部分 塩基配列識別情報 (例えば、 第 20図の 「NM— 000507 : 36丄および 「 NM— 000507 : 441」 ) と、 後述する総和算出部 102 mにて算出され た総和 (例えば、 第 20図の 「5. 9」 および 「170. 8」 ) と、 評価結果 ( 例えば、 第 20図の 「非標的」 および 「標的」 ) とを相互に関連付けて構成され ている。 なお、 第 20図において、 「非標的」 は、 規定配列情報が標的遺伝子と は無関係の遺伝子を標的にしないことを意味し、 また、 「標的」 は、 規定配列情 報が標的遺伝子とは無関係の遺伝子を標的にすることを意味する。
また、 標的遺伝子ァノテーションデータベース 106 hは、 標的遺伝子に関す るァノテーション情報を格納する標的遺伝子ァノテーション格納手段である。 な お、 標的遺伝子ァノテーションデータベース 106 hは、 インターネットを経由 してアクセスする、 遺伝子に関するァノテーション情報を格納する外部のァノテ ーシヨンデータベースであってもよく、 また、 これらのデータベースをコピーし たり、 オリジナルの配列情報を格納したり、 さらに独自のァノテーション情報等 を付加したりして作成したィンハウスデータベースであってもよい。
標的遺伝子ァノテーションデータベース 106 hに格納される情報は、 標的遺 伝子を識別する標的遺伝子識別情報 (例えば標的遺伝子の遺伝子名、 ァクセッシ ヨン (Ac c e s s i o n) 番号など (例えば、 第 3図の最上部に記載の 「NM 000507」 、 「FBP 1」 ) ) と標的遺伝子に関する簡略的な情報 (例え ば第 3図の最上部に記載の 「Homo s a i e n s f r u c t o s e— 1 , 6-b i s p h o s p h a t a s e 1」 ) とを相互に関連付けて構成されて レ、る。
また、 第 13図において、 通信制御インターフェース部 104は、 塩基配列処 理装置 100とネットワーク 300 (またはルータ等の通信装置) との間におけ る通信制御を行う。 すなわち、 通信制御インターフェース部 104は、 他の端末 と通信回線を介してデータを通信する機能を有する。
また、 第 13図において、 入出力制御インターフェース部 108は、 入力装置 1 12や出力装置 114の制御を行う。 ここで、 出力装置 114としては、 モニ タ (家庭用テレビを含む) の他、 スピーカを用いることができる (なお、 以下に おいては出力装置 114をモニタとして記載する場合がある) 。 また、 入力装置 1 12としては、 キーボード、 マウス、 および、 マイク等を用いることができる 。 また、 モニタも、 マウスと協働してポインティングデバイス機能を実現する。 また、 第 13図において、 制御部 102は、 OS (Op e r a t i n g S y s t em) 等の制御プログラム、 各種の処理手順等を規定したプログラム、 およ び所要データを格納するための内部メモリを有し、 これらのプログラム等により 、 種々の処理を実行するための情報処理を行う。 制御部 102は、 機能概念的に 、 部分塩基配列作成部 102 a、 3, 末端塩基判定部 102 b, 5 ' 末端塩基判 定部 102 c、 特定塩基含有判定部 102 d、 規定配列選択部 102 e、 オーバ 一ハング部位付加部 102 f 、 同一類似塩基配列検索部 102 g、 および、 無関 係遺伝子標的評価部 102 hを備えて構成されている。
このうち、 部分塩基配列作成部 102 aは、 RN A干渉の標的遺伝子の塩基配 列情報を取得して、 塩基配列情報の予め定めた塩基数の配列部位である部分塩基 配列情報を作成する部分塩基配列作成手段である。 ここで、 部分塩基配列作成部 102 aは、 第 21図に示ずように、 領域指定塩基配列作成部 102 i、 共通塩 基配列作成部 102 j、 および、 オーバーハング部位含有塩基配列作成部 102 kをさらに含んで構成される。 第 2 1図は、 本発明が適用される本システムの部分塩基配列作成部 1 0 2 aの 構成の一例を示すプロック図であり、 該構成のうち本発明に関係する部分のみを 概念的に示している。
第 2 1図において、 領域指定塩基配列作成部 1 0 2 iは、 塩基配列情報の標的 遺伝子のコード領域、 または、 転写領域に対応する部位から、 予め定めた塩基数 の部分塩基配列情報を作成する領域指定塩基配列作成手段である。
また、 共通塩基配列作成部 1 0 2 jは、 異なる生物に由来する複数の塩基配列 情報の間で共通する、 予め定めた塩基数の部分塩基配列情報を作成する共通塩基 配列作成手段である。
また、 オーバーハング部位含有塩基配列作成部 1 0 2 kは、 オーバーハング部 位を含む部分塩基配列情報を作成するオーバーハング部位含有塩基配列作成手段 である。
再び第 1 3図に戻り、 3, 末端塩基判定部 1 0 2 bは、 部分塩基配列情報の 3 ' 末端の塩基がアデニン、 チミン、 または、 ゥラシルである力否かを判定する 3 , 末端塩基判定手段である。
また、 5 ' 末端塩基判定部 1 0 2 cは、 部分塩基配列情報の 5 ' 末端の塩基が グァニン、 または、 シトシンである力否かを判定する 5, 末端塩基判定手段であ る。
また、 特定塩基含有判定部 1 0 2 dは、 部分塩基配列情報の 3, 末端の 7塩基 からなる塩基配列情報が、 アデニン、 チミン、 および、 ゥラシルからなる群より 選ばれる 1種または 2種以上の塩基がリッチな塩基配列情報であるか否かを判定 する特定塩基含有判定手段である。
また、 規定配列選択部 1 0 2 eは、 3, 末端塩基判定部 1 0 2 b , 5, 末端塩 基判定部 1 0 2 c、 および、 特定塩基含有判定部 1 0 2 cにて判定された結果に 基づいて、 部分塩基配列情報から標的遺伝子に特異的に R N A干渉を生じさせる 規定配列情報を選択する規定配列選択手段である。
また、 オーバーハング部位付加部 1 0 2 ίは、 規定配列情報の少なくとも一方 の末端にオーバーハング部位を付加するオーバーハング部位付加手段である。 また、 同一類似塩基配列検索部 1 0 2 gは、 規定配列情報と同一または類似の 塩基配列情報を他の塩基配列情報から検索する同一類似塩基配列検索手段である また、 無関係遺伝子標的評価部 1 0 2 hは、 同一または類似の塩基配列情報に 基づレ、て、 規定配列情報が標的遺伝子とは無関係の遺伝子を標的にするか否かを 評価する無関係遺伝子標的評価手段である。 ここで、 無関係遺伝子標的評価部 1 0 2 hは、 第 2 2図に示すように、 総和算出部 1 0 2 m、 および、 総和基準評価 部 1 0 2 nをさらに含んで構成される。
第 2 2図は、 本発明が適用される本システムの無関係遺伝子標的評価部 1 0 2 hの構成の一例を示すプロック図であり、 該構成のうち本発明に関係する部分の みを概念的に示している。 .
第 2 2図において、 総和算出部 1 0 2 mは、 同一または類似の塩基配列情報の うち標的遺伝子とは無関係の遺伝子の塩基配列情報の総数、 および、 標的遺伝子 とは無関係の遺伝子の塩基配列情報に付された同一類似の度合いを示す値 (同一 類似度) に基づいて、 同一類似の度合いを示す値の逆数の総和を算出する総和算 出手段である。
また、 総和基準評価部 1 0 2 nは、 総和算出部 1 0 2 mにて算出された総和に 基づいて、 規定配列情報が標的遺伝子とは無関係の遺伝子を標的にする力、否かを 評価する総和基準標的評価手段である。
なお、 これら各部によって行なわれる処理の詳細については、 後述する。
[システムの処理]
次に、 このように構成された本実施の形態における本システムの処理の一例に ついて、 以下に第 2 3図、 および、 第 2 4図を参照して詳細に説明する。
[メイン処理]
まず、 メイン処理の詳細について第 2 3図等を参照して説明する。 第 2 3図は 、 本実施形態における本システムのメイン処理の一例を示すフローチヤ一トであ る。 まず、 塩基配列処理装置 1 0 0は、 部分塩基配列作成部 1 0 2 aにて行われる 部分塩基配列作成処理により、 R N A干渉の標的遺伝子の塩基配列情報を取得し て標的遺伝子塩基配列ファイル 1 0 6 aの所定の記憶領域に格納し、 塩基配列情 報の予め定めた塩基数の配列部位である部分塩基配列情報を作成し、 作成された 部分塩基配列情報を部分塩基配列ファイル 1 0 6 bの所定の記憶領域に格納する (ステップ S A— 1 )。
ここで、 ステップ S A— 1において、 部分塩基配列作成部 1 0 2 aは、 領域指 定塩基配列作成部 1 0 2 iの処理により、 塩基配列情報の標的遺伝子のコード領 域、 または、 転写領域に刘—応する部位から、 予め定めた塩基数の部分塩基配列情 報を作成し、 作成された部分塩基配列情報を部分塩基配列ファイル 1 0 6 bの所 定の記憶領域に格納してもよい。
また、 ステップ S A— 1において、 部分塩基配列作成部 1 0 2 aは、 共通塩基 配列作成部 1 0 2 jの処理により、 異なる生物に由来する複数の塩基配列情報 ( 例えば、 ヒ トの塩基配列情報およびマウスの塩基配列情報など) の間で共通する 、 予め定めた塩基数の部分塩基配列情報を作成し、 作成された部分塩基配列情報 を部分塩基配列ファイル 1 0 6 bの所定の記憶領域に格納してもよレ、。 なお、 同 じ生物種における類似する複数の塩基配列情報の間で共通する、 予め定めた塩基 数の共通な部分塩基配列情報を'作成してもよい。
また、 ステップ S A—1において、 部分塩基配列作成部 1 0 2 aは、 領域指定 塩基配列作成部 1 0 2 i、 および、 共通塩基配列作成部 1 0 2 j の処理により、 異なる生物に由来する複数の塩基配列情報の標的遺伝子のコード領域、 または、 転写領域に対応する部位から、 予め定めた塩基数の共通な部分塩基配列情報を作 成し、 作成された部分塩基配列情報を部分塩基配列ファイル 1 0 6 bの所定の記 憶領域に格納してもよレヽ。 なお、 同じ生物種における類似する複数の車基配列情 報の標的遺伝子のコード領域、 または、 転写領域に対応する部位から、 予め定め た塩基数の共通な部分塩基配列情報を作成してもよい。
さらに、 ステップ S A— 1において、 部分塩基配列作成部 1 0 2 aは、 オーバ 一ハング部位含有塩基配列作成部 1 0 2 kの処理により、 オーバーハング部位を 含む部分塩基配列情報を作成してもよい。 具体的には、 例えば、 部分塩基配列作 成部 1 0 2 aは、 オーバーハング部位含有塩基配列作成部 1 0 2 kの処理により 、 オーバーハング部位が含まれていることを表すオーバーハング部位含有情報が 付加された部分塩基配列情報を作成し、 作成された部分塩基配列情報とオーバー ハング部位含有情報と相互に関連付けて部分塩基配列ファイル 1 0 6 bの所定の 記憶領域に格納してもよい。
なお、 上述の予め定めた塩基数の上限は、 オーバーハング部位を含まない場合 は、 好ましくは 2 8以下、 より好ましくは 2 2以下、 さらに好ましくは 2 0以下 であり、 オーバーハング部位を含む場合は、 好ましくは 3 2以下、 より好ましく は 2 6以下、 さらに好ましくは 2 4以下である。 また、 予め定めた塩基数の下限 は、 オーバーハング部位を含まない場合は、 好ましくは 1 3以上、 より好ましく は 1 6以上、 さらに好ましくは 1 8以上であり、 オーバーハング部位を含む場合 は、 好ましくは 1 7以上、 より好ましくは 2 0以上、 さらに好ましくは 2 2以上 である。 そして、 最も好ましい予め定めた塩基数は、 オーバーハング部位を含ま ない場合は、 1 9であり、 オーバーハング部位を含む場合は、 2 3である。 ついで、 塩基配列処理装置 1 0 0は、 3, 末端塩基判定部 1 0 2 bの処理によ り、 ステップ S A— 1にて作成された部分塩基配列情報の 3, 末端の塩基がアデ ニン、 チミン、 または、 ゥラシルである力否かを判定し、 判定した結果を判定結 果ファイル 1 0 6 cの所定の記憶領域に格納する (ステップ S A— 2 ) 。 具体的 には、 例えば、 塩基配列処理装置 1 0 0は、 3, 末端塩基判定部 1 0 2 bの処理 により、 ステップ S A—1にて作成された部分塩基配列情報の 3, 末端の塩基が アデニン、 チミン、 または、 ゥラシ Λ ^であるときには 「1」 を、 そうでないとき には 「0」 を判定結果ファイル 1 0 6 cの所定の記憶領域に格納してもよい。 . ついで、 塩基配列処理装置 1 0 0は、 5, 末端塩基判定部 1 0 2 cの処理によ り、 ステップ S A— 1にて作成された部分塩基配列情報の 5, 末端の塩基がグァ ニン、 または、 シトシンである力否かを判定し、 判定した結果を判定結果フアイ ル 1 0 6 c 所定の記憶領域に格納する (ステップ S Α— 3 ) 。 具体的には、 例 えば、 塩基配列処理装置 1 0 0は、 5, 末端塩基判定部 1 0 2 cの処理により、 ステップ S A— 1にて作成された部分塩基配列情報の 5, 末端の塩基がグァニン 、 または、 シトシンであるときには 「1」 を、 そうでないときには 「0」 を判定 結果ファイル 1 0 6 cの所定の記憶領域に格納してもよい。
ついで、 塩基配列処理装置 1 0 0は、 特定塩基含有判定部 1 0 2 dの処理によ り、 ステップ S A—1にて作成された部分塩基配列情報の 3, 末端の 7塩基から なる塩基配列情報が、 アデニン、 チミン、 および、 ゥラシルからなる群より選ば れる 1種または 2種以上の塩基がリッチな塩基配列情報である力否かを判定し、 判定した結果を判定結果ファイル 1 0 6 cの所定の記憶領域に格納する (ステツ プ S A— 4 ) 。 具体的には、 例えば、 塩基配列処理装置 1 0 0は、 特定塩基含有 判定部 1 0 2 dの処理により、 ステップ S A _ 1にて作成された部分塩基配列情 報の 3, 末端の 7塩基からなる塩基配列情報に含まれる、 アデニン、 チミン、 お ょぴ、 ゥラシルからなる群より選ばれる 1種または 2種以上の塩基の数を判定結 果ファイル 1 0 6 cの所定の記憶領域に格納してもよい。 ステップ S A— 4にお ける判定の規則は、 ステップ S A— 1にて作成された部分塩基配列情報の 3 ' 末 端近傍の塩基配列情報がアデニン、 チミン、 および、 ゥラシルからなる群より選 ばれる 1種または 2種以上の塩基がリッチな塩基配列情報であることを規定して おり、 具体的に検索を行う際の一指標として 3, 末端から 7塩基の範囲内の塩基 配列情報がアデニン、 チミン、 および、 ゥラシルからなる群より選ばれる 1種ま たは 2種以上の塩基がリツチな塩基配列情報であることを規定している。
ここで、 ステップ S A— 4において、 「リッチな塩基配列情報」 は、 上述の < 1 > R NA干渉の標的塩基配列検索方法に記述されている 「リッチな配列」 であ り、 具体的には、 例えば、 ステップ S A—1にて作成された部分塩基配列情報が 1 9塩基程度からなる場合、 当該部分塩基配列情報の 3 ' 末端の Ί塩基からなる 塩基配列情報が、 アデニン、 チミン、 および、 ゥラシルからなる群より選ばれる 1種または 2種以上の塩基が少なくとも好ましくは 3塩基以上、 より好ましくは 4塩基以上、 特に好ましくは 5塩基以上含まれる塩基配列情報である。
また、 ステップ S A— 2からステップ S A— 4において、 オーバーハング部位 を含む部分塩基配列情報を判定する場合、 部分塩基配列情報のオーバーハング部 位を除いた配列部位を判定対象として判定する。
ついで、 塩基配列処理装置 1 0 0は、 規定配列選択部 1 0 2 eの処理により、 ステップ S A— 2、 ステップ S A— 3、 および、 ステップ S A— 4にて判定され た結果に基づいて、 ステップ S A— 1にて作成された部分塩基配列情報から標的 遺伝子に特異的に R NA干渉を生じさせる規定配列情報を選択し、 規定配列ファ ィル 1 0 6 dの所定の記憶領域に格納する (ステップ S A— 5 )。
具体的には、 例えば、 塩基配列処理装置 1 0 0は、 規定配列選択部 1 0 2 eの 処理により、 ステップ S A— 2にて 3 ' 末端の塩基がアデニン、 チミン、 または 、 ゥラシルであると判定され、 ステップ S A— 3にて 5, 末端の塩基がグァニン 、 または、 シトシンであると判定され、 力つ、 ステップ S A— 4にて部分塩基配 列情報の 3, 末端の 7塩基からなる塩基配列情報が、 アデニン、 チミン、 および 、 ゥラシルからなる群より選ばれる 1種または 2種以上の塩基がリッチな塩基配 列情報であると判定された部分塩基配列情報を規定配列情報として選択し、 規定 配列ファイル 1 0 6 dの所定の記憶領域に格納する。 ここで、 具体的には、 例え ば、 塩基配列処理装置 1 0 0は、 規定配列選択部 1 0 2 eの処理により、 ステツ プ S A— 2、 ステップ S A— 3、 および、 ステップ S A— 4にて出力される数値 の積を算出し、 当該積の値に基づいて、 ステップ S A— 1にて作成された部分塩 基配列情報から規定配列情報を選択してもよい。
ここで、 塩基配列処理装置 1 0 0は、 オーバーハング部位付加部 1 0 2 f の処 理により、 ステップ S A— 5にて選択された規定配列情報の少なくとも一方の末 端にオーバーハング部位を付加して、 規定配列ファイル 1 0 6 dの所定の記憶領 域に格納してもよい。 具体的には、 例えば、 塩基配列処理装置 1 0 0は、 オーバ 一ハング部位付加部 1 0 2 f の処理により、 規定配列ファイル 1 0 6 dの規定配 列情報の項に記憶されている規定配列情報を、 少なくとも一方の末端にオーバー ハング部位が付加された規定配列情報に書き換えてもよい。 なお、 例えば、 ター ゲット側を検索する場合は、 規定配列情報の両末端にオーバーハング部位を付加 してもよレ、。
なお、 上述のオーバーハング部位の塩基数は、 上述の < 2 > R NA干渉を生じ させるポリヌクレオチドの塩基配列設計方法に記述されている塩基数であり、 具 体的には、 例えば、 2が特に好適である。
また、 ±直基配列処理装置 100は、 同一類似塩基配列検索部 102 gの処理に より、 ステップ SA— 5にて選択された規定配列情報と同一または類似の塩基配 列情報を、 他の塩基配列情報 (例えば NCB Iの R e f S e qなどの公的データ ベースで公開されている塩基配列情報) 力、ら、 例えば BLAST、 FASTA、 s s e a r c liなどの既存のホモロジ一検索手法を用いて検索し、 無関係遺伝子 標的評価部 102 hにて行われる無関係遺伝子標的評価処理により'、 検索された 同一または類似の塩基配列情報に基づいて、 規定配列情報が標的遺伝子とは無関 係の遺伝子を標的にするか否かを評価してもよい。
具体的には、 例えば、 塩基配列処理装置 100は、 同一類似塩基配列検索部 1 02 gの処理により、 ステップ SA— 5にて選択された規定配列情報と同一また は類似の塩基配列情報を、 他の塩基配列情報 (例えば NCB Iの R e f S e qな どの公的データベースで公開されている塩基配列情報) 力 ら、 例えば B LAST 、 FASTA、 s s e a r c liなどの既存のホモロジ一検索手法を用いて検索し 、 無関係遺伝子標的評価部 102 hは、 総和算出部 102 mの処理により、検索 された同一または類似の塩基配列情報のうち標的遺伝子とは無関係の遺伝子の塩 基配列情報の総数、 および、 標的遺伝子とは無関係の遺伝子の塩基配列情報に付 された同一類似の度合いを示す値 (例えば BLAST、 FASTAおよび s s e a r c liの場合は、 「E v a 1 u e」 ) に基づいて、 同一類似の度合いを示す 値の逆数の総和を算出し、 無関係遺伝子標的評価部 102 hは、 総和基準評価部 102ηの処理により、 算出された総和に基づいて、 規定配列情報が標的遺伝子 とは無関係の遺伝子を標的にするか否かを評価してもよレ、。
ここで、 無関係遺伝子標的評価部 102上にて行われる無関係遺伝子標的評価 処理の詳細について第 24図を参照して説明する。
第 24図は、 本実施形態における本システムの無関係遺伝子標的評価処理の一 例を示すフローチャートである。 ' まず、 塩基配列処理装置 100は、 同一類似塩基配列検索部 102 gの処理に より、 ステップ SA— 5にて選択された規定配列情報と同一または類似の塩基配 列情報を、 他の塩基配列情報 (例えば NCB Iの R e f S e qなどの公的データ ベースで公開されている塩基配列情報) 力^、 例えば BLAST、 FASTA、 s s e a r c hなどの既存のホモロジ一検索手法を用いて検索し、 規定配列情報 の識別情報 (第 19図における 「部分塩基配列識別情報」 ) と、 検索された同一 または類似の塩基配列情報の識別情報 (第 19図における 「参照配列識別情報」 ) と、 検索された同一または類似の塩基配列情報に付された同一類似の度合いを 示す値 (例えば BLAST、 FAST Aおよぴ s s e a r c hの場合は、 「E V a 1 u e」 ) (第 19図における 「同一類似度」 ) とを相互に関連付けて、 同 一類似度フアイノレ 106 f の所定の記憶領域に格納する。
ついで、 無関係遺伝子標的評価部 102 hは、 総和算出部 102 mの処理によ り、 検索された同一または類似の塩基配列情報のうち標的遺伝子とは無関係の遺 伝子の塩基配列情報の総数、 および、 標的遺伝子とは無関係の遺伝子の塩基配列 情報に付された同一類似の度合いを示す値 (例えば BLAST、 FASTAおよ ぴ s s e a r c hの場合は、 「E v a 1 u e」 ) に基づいて、 同一類似の度合 レ、を示す値の逆数の総和を算出し、 規定配列情報の識別情報 (第 20図における 「部分塩基配列識別情報」 ) と算出された総和 (第 20図における 「総和」 ) と を相互に関連付けて、 評価結果ファイル 106 gの所定の記憶領域に格納する ( ステップ SB— 1)。
ついで、 無関係遺伝子標的評価部 102 hは、 総和基準評価部 102ηの処理 により、 ステップ SB— 1にて算出された総和に基づいて (例えば、 ステップ S B— 1にて算出された総和の大小などに基づいて) 、 規定配列情報が標的遺伝子 とは無関係の遺伝子を標的にする力否かを評価し、 評価結果 (第 20図における 「非標的」 および 「標的」 ) を評価結果ファイル 106 gの所定の記憶領域に格 納する (ステップ SB— 2) 。
これにて、 メイン処理が終了する。
[他の実施の形態]
さて、 これまで本発明の実施の形態について説明したが、 本発明は、 上述した 実施の形態以外にも、.請求の範囲に記載した技術的思想の範囲内において種々の 異なる実施の形態にて実施されてよいものである。
例えば、 塩基配列処理装置 100がスタンドアローンの形態で処理を行う場合 を一例に説明したが、 塩基配列処理装置 100とは別筐体で構成されるクライア ント端末からの要求に応じて処理を行い、 その処理結果を当該クライアント端末 に返却するように構成してもよい。 具体的には、 例えば、 クライアント端末は R N A干渉の標的遺伝子の名称 (例えば遺伝子名、 ァクセッション番号など) また は標的遺伝子に係る塩基配列情報を塩基配列処理装置 100に送信し、 塩基配列 処理装置 100は当該名称に対応する塩基配列情報またはクライアント端末より 送信された塩基配列情報に対して制御部 102で行われる上述した各処理を行レヽ 、 標的遺伝子に特異的に RNA干渉を生じさせる規定配列情報を選択してクライ アント端末に送信してもよい。 この場合、 例えば、 クエリーの遺伝子に対して公 共データベースから配列情報を取得して s i RNAを選択してもよく、 また、 例 えば、 予め全遺伝子の s i RNAを計算して記憶しておき、 クライアント端末か らの要求 (遺伝子の名称またはァクセッション番号など) に対して即座に s i R NAを選択し、 選択した s i RNAをクライアント端末に返してもよい。
また、 塩基配列処理装置 100は、 標的遺伝子とは無関係の遺伝子に対する規 定配列情報の特異性を確認してもよい。 これにより、 標的とする遺伝子のみに特 異的に RN A干渉を生じさせる規定配列情報を選出することができる。
また、 クライアント端末と塩基配列処理装置 100とで構成される本システム には、 例えば、 We bページの利用者から、 s i RNAのRNA干渉効果 (例え ば、 「効く」 、 「効かなレ、」 など) の結果を W e b上でフィードバックしてもら レ、、 利用者からフィードバックされた実験例を塩基配列処理装置 100に蓄積し 、 上述した RN A干渉に有効な s i RNAの配列規則性を改善するためのインタ 一フェース機能を導入してもよい。
また、 塩基配列処理装置 100は、 規定配列情報から s i RNAのセンス鎖の 塩基配列情報および当該センス鎖と相補的 (c omp l eme n t a r y) なァ ンチセンス鎖の塩基配列情報を計算してもよレ、。 具体的には、 例えば、 塩基配列 W
49 処理装置 100は、 上述した各処理の結果、 規定配列の両端に各 2塩基のオーバ 一ハング部を付加した 23塩基の配列情報として 「c a C C C t g a c c c g c t t c g t c a t g gj を選択した場合、 センス鎖の塩基配列情報 「5, -CC CUGACCCGCUUCGUCAUGG-3' J およびアンチセンス鎖の塩基 配列情報 「5' -AUGACGAAGCGGGUCAGGGUG-3 ' 」 を計算 する。 これにより、 ポリヌクレオチドを発注する時にセンス鎖、 アンチセンス鎖 を手作業でまとめる必要がなくなり、 利便性が高まる。
また、 実施形態において説明した各処理のうち、 自動的に行なわれるものとし て説明した処理の全部または一部を手動的に行うこともでき、 あるいは、 手動的 に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に 行うこともできる。
この他、 上記文書中や図面中で示した処理手順、 制御手順、 具体的名称、 各種 の登録データや検索条件等のパラメータを含む情報、 画面例、 データベース構成 については、 特記する場合を除いて任意に変更することができる。
また、 塩基配列処理装置 100に関して、 図示の各構成要素は機能概念的なも のであり、 必ずしも物理的に図示の如く構成されていることを要しなレ、。
例えば、 塩基配列処理装置 100の各部または各装置が備える処理機能、 特に 制御部 102にて行なわれる各処理機能については、 その全部または任意の一部 ' を、 CPU (Ce n t r a l P r o c e s s i n g Un i t) および当該 C PUにて解釈実行されるプログラムにて実現することができ、 あるいは、 ワイヤ —ドロジックによるハードウェアとして実現することも可能である。 なお、 プロ グラムは、 後述する記録媒体に記録されており、 必要に応じて塩基配列処理装置 100に機械的に読み取られる。
すなわち、 ROMまたは HDなどの記憶部 106などには、 OS (O e r a t i n g Sy s t em) と協働して C P Uに命令を与え、 各種処理を行うため のコンピュータプログラムが記録されている。 このコンピュータプログラムは、 RAM等にロードされることによって実行され、 CPUと協働して制御部 1◦ 2 を構成する。 また、 このコンピュータプログラムは、 塩基配列処理装置 100に 対して任意のネットワーク 300を介して接続されたアプリケーションプロダラ ムサーバに記録されてもよく、 必要に応じてその全部または一部をダウンロード することも可能である。
また、 本発明にかかるプログラムを、 コンピュータ読み取り可能な記録媒体に 格納することもできる。 ここで、 この 「記録媒体」 とは、 フレキシブルディスク 、 光磁気ディスク、 R〇M、 EPROM, EE PROM, CD-ROM, M〇、 DVD, フラッシュディスク等の任意の 「可搬用の物理媒体」 や、 各種コンビュ ータシステムに内蔵される ROM、 RAM、 HD等の任意の 「固定用の物理媒体 」 、 あるいは、 LAN、 WAN, インターネットに代表されるネットワークを介 してプログラムを送信する場合の通信回線や搬送波のように、 短期にプログラム を保持する 「通信媒体」 を含むものとする。
また、 「プログラム」 とは、 任意の言語や記述方法にて記述されたデータ処理 方法であり、 ソースコードゃパイナリコード等の形式を問わない。 なお、 「プロ グラム」 は必ずしも単一的に構成されるものに限られず、 複数のモジュールゃラ イブラリとして分散構成されるものや、 OS (Op e r a t i n g Sy s t e m) に代表される別個のプログラムと協働してその機能を達成するものをも含む 。 なお、 実施の形態に示した各装置において記録媒体を読み取るための具体的な 構成、 読み取り手順、 あるいは、 読み取り後のインストール手順等については、 周知の構成や手順を用いることができる。
記憶部 106に格納される各種のデータベース等 (標的遺伝子塩基配列フアイ ノレ 106 a〜標的遺伝子ァノテーションデータベース 106 h) は、 RAM、 R OM等のメモリ装置、 ハードディスク等の固定ディスク装置、 フレキシブルディ スク、 光ディスク等のストレージ手段であり、 各種処理やウェブサイト提供に用 Vヽる各種のプログラムやテ一ブノレやフアイノレゃデータベースゃゥェブぺージ用フ アイル等を格納する。
また、 塩基配列処理装置 100は、 既知のパーソナルコンピュータ、 ワークス テ一ション等の情報処理端末等の情報処理装置にプリンタゃモ タやイメージス キヤナ等の周辺装置を接続し、 該情報処理装置に本発明の方法を実現させるソフ トウエア (プログラム、 データ等を含む) を実装することにより実現してもよい さらに、 塩基配列処理装置 100等の分散 ·統合の具体的形態は明細書および 図面に示すものに限られず、 その全部または一部を、 各種の負荷等に応じた任意 の単位で、 機能的または物理的に分散 ·統合して構成することができる (例えば 、 グリッド 'コンピューティングなど) 。 例えば、 各データベースを独立したデ ータベース装置として独立に構成してもよく、 また、 処理の一部を CG I (Co mmo n Ga t ewa y I n t e r f a c e) を用いて実現してもよい。 また、 ネットワーク 300は、 塩基配列処理装置 100と外部システム 200 とを相互に接続する機能を有し、 例えば、 ィンターネットゃ、 イントラネットゃ 、 LAN (有線 Z無線の双方を含む) や、 VANや、 パソコン通信網や、 公衆電 話網 (アナログ/デジタルの双方を含む) や、 専用回線網 (アナログ/デジタル の双方を含む) や、 CATV網や、 IMT2000方式、 03:^方式または卩0
C/P DC— P方式等の携帯回線交換網 Z携帯バケツト交換網や、 無線呼出網や 、 : B l u e t o o t h等の局所無線網や、 PHS網や、 CS、 BSまたは I SD B等の衛星通信網等のうちいずれかを含んでもよレ、。 すなわち、 本システムは、 有線 ·無線を問わず任意のネットワークを介して、 各種データを送受信すること ができる。 実施例
以下、 実施例を示し、 本発明についてより具体的に説明するが、 本発明は下記 実施例に限定されるものではない。
[実施例 1 ]
< 1 >RNA i効果を測定するための遺伝子、 発現べクター
s i RNAによる RNA i効果を測定するための標的遺伝子としてはホタル (
Ph o t i nu s p y r a l i s, P. p y r a i i s) の l u c i f e r a s e ( 1 u c ) 遺 子 (P. p y r a l i s 1 u c遺 子: a c c e s s i o n n umb e r : U47296) を用い、 これを含む発現ベクターとし ては p GL 3_C o n t r o lベクター (P r ome g a社製) を用いた。 P. P y r a 1 i s 1 u c遺伝子断片はこのベクター中で S V 40のプロモーター とポリ Aシグナルで挟まれた形になっている。 また内部コント口ール遺伝子はゥ -ンィタケ (R e n i l l a r e n i f o r m i s , R. r e n i f o r m i s) の l u c遺伝子を用い、 これを含む発現ベクターとして p RL— TK ( P r ome g a社製) を用いた。
く 2 > 2 1塩基 2本鎖 RNA ( s i RNA) の合成
2 1塩基センス鎖と 2 1塩基アンチセンス鎖 RN A (第 9図にしめされている 位置のもの; a〜p) は、 日立計測器サービス株式会社を通じてジェンセット株 式会社に合成を委託した。
P. p y r a 1 i s 1 u c遺伝子の発現を阻害するために用いた 2本鎖 RN Aは、 センス鎖とアンチセンス鎖とを会合させることで作製した。 会合は、 セン ス鎖 RNAとアンチセンス鎖 RNAを、 1 OmM T r i s—HC l (pH7. 5 ) , 2 OmM N a C 1反応液中で 9 0 °C、 3分間加熱し、 3 7でで 1時間ィ ンキュペートし、 その後室温になるまで放置することで行った。 2本鎖ポリヌク レオチドの形成は、 T B E緩衝液中での 2 %ァガ口ースゲルでの電気泳動で検定 するが、 上記条件では殆どすベての 1本鎖ポリヌクレオチドが 2本鎖ポリヌクレ ォチドに会合していた。
< 3〉哺乳類細胞培養法
哺乳類培養細胞としては、 ヒ トの H e L a細胞と HE K 2 9 3細胞、 チヤィ- ーズハムスターの CHO— K I細胞 (R I KEN C e l l b a n k) を用い た。 培地は D u 1 b e c c o ' s mo d i f i e d E a g l e ' s me d i um (G i b c o BRL難) に非慟ィ匕 1 0%牛胎児血清 (M i t s u b i s h i K a s e iネ環) 及ぴ抗生物質として p e n i c i 1 1 i n (Me i j i社製) 1 0 u n i t s /m 1、 s t r e p t omy c i n (Me i j i社製) 5 0 μ g/m 1を添カロしたものを用いた。 3 7°C、 5 % C〇2存在下で培養した < 4 >哺乳類培養細胞への標的遺伝子、 内部コント口ール遺伝芋、 s i R N Aの 培養細胞へのトランスフエクシヨン
哺乳類細胞は 0. 2~0. 3 X 106c e 1 1 s Zm 1の濃度で 24穴プレー トにまき、 1日後に C a— p h o s p h a t e沈殿法 (細胞工学ハンドブック、 黒木登志夫ら編、 羊土社 (1992) ) で 1. O ^ g pGL3-Co n t r o 1 DNA、 0. 5または 1. 0 μ g p RL-TK DNA、 及び 0. 01、 0. 1、 1、 10、 1◦ 0 nMの各 s i RNAを導入した。
< 5〉ショウジョゥバエ細胞培養法
ショウジョゥパェ培養細胞としては S 2細胞 (S c hn e i d e r, I . , e t a 1. , J . Emb r y o 1. E . Mo r p h. , 27, 353-365 (1972) ) を用いた。 培地は S c hn e i d e r' s D x
0 s o p h i l a me d i um (G i b c o BR L ± ) に非慟化 10 %牛 胎児血清 (Mi t s ub i s h i Ka s e i社製) 及ぴ抗生物質として p e n
1 c i 1 1 i n (Me i j i社製) 10un i t s/ml、 s t r e p t omy c i n (Me i j i社製) 50 μ g/m 1を添加したものを用いた。 25°C、 5 %co2存在下で培養した。
< 6 >ショウジョゥパェ培養細胞への標的遺伝子、 内部コント口ール遺伝子、 s i R N Aの培養細胞へのトランスフエクシヨン
この S 2細胞は;!. 0 X 106c e 1 1 s /m 1の濃度で 24穴プレートにま き、 1日後に Ca— p h o s ph a t e沈殿法 (細胞工学ハンドブック、 黒木登 志夫ら編、 羊土社 (1992) ) で 1. 0 g pGL-3 Con t r o l DNA、 0. 1 u g p RL-TK DNA、 及ぴ 0. 01、 0. 1、 1、 10 、 100 nMの各 s i RNAを導入した。
< 7〉RNA i効果の測定
s i RNAをトランスフエクシヨンした細胞は、 トランスフエクシヨン後 20 時間後に回収し、 Du a l—Lu c i i e r a s e Re p o r t e r As s a y Sy s t em (P r o me g a社製) を用いて、 2種類のノレシフェラーゼ . p y r a l i s l u c及び R . r e n i f o rm i s l u c) タ ンパクの発'現量 (ルシフエラーゼ活性) を測定した。 発光量の測定は L u m a t LB 9507 l um i n ome t e r (EG&G B e r t h o 1 d) を用い て行つた。
< 8 >結果
ルシフェラーゼ活性を測定した結果を第 10図に示す。 また、 ルシフェラーゼ 活性と各塩基配列との対応を検討した結果を第 11図に示す。 .
第 10図中、 Bで示されるグラフはショウジヨウバエでの結果であり、 Cで示 されるグラフはヒ トでの結果を示す。 第 10図に示されるように、 ショウジヨウ バエでは塩基数を 21の RNAを作製することにより、 殆どの配列においてルシ フェラーゼ活性を抑制できた。 他方、 ヒ トの場合については、 単に塩基数を 21 としただけではルシフェラーゼ活性を抑制できる配列力 S得られにくいことが明ら かとなつた。
そこで、 a〜pの RNAの塩基配列の規則性を分析した。 配列の分析は、 第 1 1図に示すように 2本鎖 RN Aの 5箇所について塩基配列を分析した。 第 1 1図 の表中最上段の aの s i RNAについてみると、 ルシフェラーゼ相対活性 (R L A) は 0. 03、 アンチセンス鎖について 3, 末端側から順に見ると、 オーバー ハング部 (OH) の塩基配列が UC、 続く 7塩基 (図 1 1中 3, 一 T) 中の G/ C含有量 (グァニンまたはシトシンの含有量) は 57%、 さらに続く 5塩基 (第 1 1図中 M) の G/C含有量は 20であり、 さらに続く 7塩基 (第 1 1図中 5' 一 T) の G/C含有量は 14%であり、 5' 末端は Uであり、 合計の G/C含有 量は 32%である。 表中、 RLAの値が低いほど、 RLAの活性が低く、 すなわ ち ンフエラーゼの発現が抑制されたことを示す。
この結果から、 RNA干渉を生じさせるポリヌクレオチドの塩基配列は、 3, 末端がアデニンまたはゥラシルであり 5' 末端がグァニンまたはシトシンである 確率が極めて高いことが明らかになった。 また、 3' 末端側の 7塩基ついてはァ デニンまたはゥラシルが豊富な状態であることが明らかとなった。
[実施例 2]
1. 標的発現ベクター pTRECの構築 下記のようにして標的発現べクターを構築した。 標的発現分子は、 RNA iの 標的となる配列 (以下 「標的配列」 という場合がある) を有する RNAを発現さ せる分子である。
p C I -n e o (GenBank AccessionNo. U47120、 プロメガ社製) の CMVェン ハンサー /プロモーター下流に標的 mRNA配列を構築した (第 25図) 。 すな わち、 コザック配列 (Ko z a k) 、 ATG配列、 標的となる 23塩基対配列ク ローニングサイト (t a r g e t) 及び組み換えのための制限酵素 (Nh e I、 E c o R I、 Xh o I) 認識配列を有する下記の 2本鎖ォリゴマーを合成した。 2本鎖オリゴマ一は配列表の配列番号 1に示す配列とその相補的な配列とからな る。 合成した 2本鎖オリゴマーを p C I— n e oの Nh e I、 Xb a Iサイトに 揷入し、 標的発現ベクター pTRECを構築した (第 25図) 。 なお、 イントロ ンは、 ; C I— n e oに当初から組み込まれている —グロビン由来のイントロ ン部位を用いた。
5 -gctagccaccatggaattcacgcgtctcgagtctaga-3' (酉己列番号 1 )
第 25図に示す pTRECは、 プロモーターおよぴェンハンサー (p r oZe n ) 、 と PCRプライマーに対応する領域 PAR (F) 1および PAR (R) 1を備ええる。 PAR (F) 1にはイントロン (I n t r o n) が挟み込まれて おり、 発現ベクターそのものが PCRの铸型とならないように設計されている。 pTRECは、 RNAの転写後、 真核生物の培養細胞などのスプライシングが行 われる環境下において、 イントロン部位が除去され、 PAR (F) 1が連結され る。 p TRECから形成された RNAは RT— PCRにより増幅できる。 イント ロンは、 p C I— n e oに当初から,袓み込まれている β一グロビン由来のイント ロン部位を用いた。
pTRECには、 コントロールとしてネオマイシン耐性遺伝子 (n e o) が組 み込まれており、 ネオマイシン耐性遺伝子内の配列の一部に対応する P C Rプラ イマ一を作製し、 ネオマイシン耐性遺伝子の一部について RT— PC Rを行うこ とにより、 ネオマシン耐性遺伝子を内部標準コントロール (ィンターナノレコント ロール) として用いることができる。 PAR (F) 2および PAR (R) 2は、 ネオマイシン耐性遺伝子中の PCRプライマー対応領域を示す。 なお、 第 25図 の例には示していないが、 PAR (F) 2または PAR (R) 2の少なくとも一 方にもイントロンを挟み込んでおくこともできる。 ·
2. 標的 mRN A検出用プライマーの効果
(1) 培養細胞へのトランスフエクシヨン
24穴プレートの 1穴あたりに 0. 2〜0. 3X l 06c e l l sの He La 細胞をまき、 1日後に Lipofectamine 2000 (Invitrogen社製) を用いて、 マ二 ュアルにしたがって 0. 5 μ gの p TRECベクターをトランスフエタトした。 (2) 細胞の回収おょぴ mRN Aの定量
トランスフエクシヨンの 1日後、 細胞を回収し、 Trizol (Invitrogen社製)を 用いて全 RNAを抽出した。 この RNA100 n gを用いて、 オリゴ (dT) を プライマーとし、 Superscript II RT (Invitrogen社製)により逆転写して c D N A合成反応を行った。 コントロールとして、 逆転写酵素を加えないものを用意し た。 得られた cDNAの 320分の 1量を PC Rテンプレートとし、 SYBR Green PGR Master Mix (Applied Biosystems社製)を用いて、 50 1の反応系で定量的 PCRを行い、 標的 mRNA (mRNA (T) と称する) および、 内部コント口 ールとして pTR EC上のネオマイシン耐性遺伝子に由来する mRNA (mRN A (C) と称する) を定量した。 定量的 PCRにはリアルタイムモニタリング装 置 ABI PRIZM7000 (Applied Biosystems社製)を用い、 mRNA (T) の定量には プライマー対 T (配列表配列番号 2、 3) 、 mRNA (C) の定量にはプライマ 一対 C (配列表配列番号 4、 5) をそれぞれ使用した。
プライマー対 T:
aggcactgggcaggtgtc (配歹 (J番号 2 )
tgctcgaagcattaaccctcacta (酉己列番号 3ノ
プライマー対 C
atcaggatgatctggacgaag (酉 S歹 (J番号 4 )
ctcttcagcaatatcacgggt (酉己列番号 5 ) 第 26図および第 27図に、 PCRの結果を示す。 第 26図おょぴ第 27図は 、 縦軸にそれぞれの PC R産物を、 横軸に PCRのサイクル回数をとり、 グラフ に表したものである。 ネオマイシン耐性遺伝子の場合、 逆転写酵素により cDN Aを合成したもの (+RT) と、 逆転写酵素を加えないコントロール (一 RT) で、 得られた PC R産物量の増幅の差は小さかった (第 26図) 。 これは、 cD N Aのみならず、 細胞内に残っているべクターも P C Rの铸型となって増幅され たことを示す。 他方、 標的配列 mRNAでは、 逆転写酵素を添加した場合 (+ T) と添加しない場合 (-RT) とによる差が大きかった (第 27図) 。 この結 果は、 プライマー対丁のうちの一方がィントロンをはさむ形でデザインされてい るため、 イントロンが除去された mRNAに由来する c DNAが効率的に増幅さ れる一方、 イントロンを有する残存ベクターが铸型となりにくくなつていること を示している。
3,. s i RNAによる標的 mRNAの発現抑制
( 1 ) ターゲット発現べクタ一への評価配列のクローニング
ヒ トビメンチン (V I M) 遺伝子(RefSeqID: 雨— 003380)コード領域の 812 - 834, 35 - 57に相当する配列を評価の対象とした。 これらの配列および EcoRI、 Xliolの認識配列を有する下記配列表配列番号 6および 7の合成オリゴヌ クレオチド (評価配列フラグメント) を作製した。
評価配列 V I M 35 (V I Mの 35— 57に相当)
5 -gaattcgcaggatgttcggcggcccgggcctcgag-3' (酉己列番"^ 6)
評価配列 V IM812 (V I Mの 812— 834に相当)
5 -gaattcacgtacgtcagcaatatgaaagtctcgag-3' (酉己列 ¾·号 7ノ
得られた評価配列フラグメントの両端にある EcoRI、 Xholサイトを利用し、 p TRECの EcoRI、 Xholサイト間に、 新たな標的配列としてクローニングし、 p TREC - VI M35、 p TREC - V I M812を構築した。
(2) s i RNAの作製
評価配列 V IM35 (配列表配列番号 8、 第 28図) 、 評価配列 V IM812 (配列番号 9、 第 29図) 、 及びコントロール配列 (siContorol, 配列畚号 10 、 第 30図) にそれぞれ相当する s i RNAフラグメントを合成し、 ァニーリン グした。 下記 s i RNAの各配列においては、 3, 末端にオーバーハング部を設 けてある。
siVIM35 ΰ -aggauguucggcggcccgggc-3 ' (配歹 U番号 8)
siVIM812 ΰ -guacgucagcaauaugaaagu-3 ' (酉己歹幡号 9)
コントロールとじて、 ルシフェラーゼ遺伝子に対する s i RNAを用いた。 siControl り -cauucuauccgcuggaagaug-3' (酉 3歹 IJ番号 10)
(3) 培養細胞へのトランスフエクシヨン
24穴プレートの 1穴あたりに 0. 2〜0. 3 X 106 c e 1 1 sの H e L a 細胞をまき、 1日後に Lipofectamine 2000 (Invitrogen社製) を用いて、 マ二 ユアノレにしたがって 0. 5 μ gの pTREC - V I M35または pTREC - V IM812と、 それぞれの V IM由来配列に相当する 100 nMの s i RNA ( s i V IM35、 s i V IM812) を同時にトランスフエクトした。 コント口 ール細胞には、 0. 5 gの pTREC - V IM35または pTREC - V IM 812と 100 nMのルシフェラーゼ遺伝子に対する s i RNA ( s i C o n t r o l) を同時にトランスフエタトした。
(4) 細胞の回収おょぴ mRNAの定量
トランスフエクシヨンの 1日後、 細胞を回収し、 Trizol (Invitrogen)を用いて 全 RNAを抽出した。 この RNA 100 n gを用いて、 オリゴ (dT) をプライ マーとし、 Superscript II RT (Invitrogen社製) により逆転写して c DNAを 得た。 得られた cDNAの 320分の 1量を PC Rテンプレートとし、 SYBR Green PCR Master Mix (Applied Biosystems社製)を用いて、 50 1の反応系で 定量的 PCRを行い、 評価しょうとする V IM由来の配列を含む mRNA (mR NA (T) と称する) および内部コントロールとして、 pTREC上のネオマイ シン耐性遺伝子に由来する mRNA (mRNA (C と称する) を定量した。 定量的 P CRにはリアルタイムモニタリング装置 ABI PRIZM7000 (Applied Biosystems社製)を用い、 mRNA (T) の定量にはプライマー対 T (配列表配 列番号 2および 3) 、 mRNA (C) の定量にはプライマー対 C (配列表配列番 号 4および 5) をそれぞれ使用した。 得られたそれぞれの mRN Aの値の比 (T /C) を縦軸 (標的 niRNA相対量 (%) ) としてグラフに表した (第 3 1図) コントロール細胞の場合、 ルシフェラーゼ遺伝子に対する s i RNAは標的m RNAに効果を及ぼさないため、 T/C比はほぼ 1になった。 V IM8 1 2 s i RNAでは、 TZC比が著しく下がった。 これは、 V I M8 1 2 s i RNA 、 相当する配列を有する mRNAを切断したためであり、 V IM8 1 2 s i RNAが RNA i効果を有することが示された。 一方、 V I M3 5 s i RNA の場合、 T/C比はコントロールとほぼ同じ値であったことから、 V IM3 5の 配列には RNA i効果がほとんどないことが示された。
[実施例 3]
1. s i R N Aによる内在性ビメンチンの発現抑制
(1) 培養細胞へのトランスフエクシヨン
24穴プレートの 1穴あたりに 0. 2〜0. 3 X 1 06 c e l l s の H e L a細胞をまき、 1日後に Lipofectamine 2000 (Invitrogen社製) を用いて、 マ 二ユアノレにしたがって、 V IMに対する s i RNA (s 丄 ¥ 1]^3 5または5 i V I M8 1 2) またはコントロール s i RNA (s i C o n t r o l ) 1 00 n M、 トランスフエクシヨン効率のコントロールとして 0. 5 gの: EGF P ( Clontech社製) を同時にトランスフエクトした。 p EGFPは EGF Pが組み 込まれている。
( 2 ) 内在性ビメンチン m R N Aの測定
トランスフエクシヨンの 3日後、 細胞を回収し、 Trizol (Invitrogen社製)を 用いて全 RNAを抽出した。 この RNA 1 00 n gを用いて、 オリゴ (d T) を プライマーとし、 Superscript II RT (Invitrogen社製)により逆転写して c DN A合成反応を行なった。 得られた c DNA産物を鍚型として、 ビメンチンに対す るプライマー V IM— F 3— 84、 V I M— R 3— 274 (配列番号 1 1、 1 2 ) を用いて PCRを行った。
VIM-F3-84; gagctacgtgactacgtcca (配列番号 1 1 ) VIM-R3-274; gttcttgaactcggtgttgat (配列番号 12) .
また、 コントロールとして、 /3—ァクチンに対するプライマー ACTB- F2- 481、 ACTB-R2-664 (配列番号 13、 14) を用いて PC Rを行い、 各サンプル間の 0 ーァクチンの定量値を合わせたうえで、 ビメンチンの発現量を評価した。
ACTB-F2-481; cacactgtgcccatctacga (配列番号 13) ' ACTB-R2-664; gccatctcttgctcgaagtc (配列番号 14 )
結果を第 32図に示す。 第 32図では、 s i C o n t r o 1 (すなわち、 標的 とは無関係な配列) を入れた場合を 100%として比較し、 V IMに対する s i RNAを入れた場合に、 V IMの mRNAがどの程度減少したかを表している。 s i V IM-812は効果的に V I M mRNAを抑制できたのに対して、 s i V IM-35を用いた場合はほとんど RNA i効果を示さなかった。
(3) 細胞の抗体染色
トランスフエクシヨンの 3日後、 細胞を 3. 7%のホルムアルデヒドにより固 定し、 定法によりプロッキングを行った。 その後、 ゥサギ抗ビメンチン抗体 (α — V IM) または内部コントロールとしてゥサギ抗 Y e s抗体 (α— Ye s) を 加え、 室温で反応させた。 その後、 細胞表面を PBS (Phosphate Buffered Saline; リン酸緩衝生理食塩水) で洗浄し、 二次抗体として蛍光標識抗ゥサギ I gG抗体を加え、 室温で反応させた。 細胞表面を PBSで洗浄の後、 蛍光顕微鏡 による観察を行った。
蛍光顕微鏡観察の結果を第 33図に示す。 第 33図中、 9つの各枠内において 白く現れている部分が蛍光部分である。 EGFPおよび Ye sについては、 何れ の細胞でも同程度の発現が確認、された。 s i Con t r o l、 s iV IM35を 導入した細胞では、 ビメンチンの抗体染色による蛍光が観察され、 内在性ビメン チンの存在が確認された。 一方、 s i V IM812を導入した細胞では、 s i C o n t r o l、 s i V IM35を導入した細胞に比べて蛍光が著しく弱かった。 この結果は、 s i V IM812により内在性のビメンチン mRNAが干渉を受け た結果、 ビメンチンの蛋白質の発現量が減少したことを示すものであり、 s i V IM8 1 2は内在性ビメンチン mRNAにも RNA i効果を有することが明らか になった。
本発明のアツセィ系で得られた結果 [実施例 2] は、 実際に内在性遺伝子に対 してそれぞれの s i RNAを用いた結果 [実施例 3] とよく一致していたため、 このァッセィ系は任意の s i RNAの RNA i活性を評価する方法として有効で あることが示された。 .
[実施例 4]
上記所定の規則 (a) 〜 (d) に基づき塩基配列を設計した。 塩基配列の設計 は、 上記 s i R N A配列設計プログラムを実行する塩基配列処理装置によつて行 つた。 塩基配列は、 R N A i活性を有すると予測される配列 1 5種 (配列番号 1 5-29) と、 RNA i活性を有しなレ、と予測される配列 5種 (配列番号 30〜 34) を用意した。
設計された配列に基づき標的配列および評価対象の s i RNAを調製する以外 、 上記実施例 1と同様にして、 ルシフェラーゼ活性を測定することにより、 R NA i活性の評価を行つた。 結果を第 34図に示す。 ルシフェラーゼ相対活性値 が低いものが効いている状態、 すなわち RNA i活性を備えた s i RNAである
。 上記プログラムにより RNA i活性を有すると予測された s i RNAは、 全て 'ルシフヱラーゼの発現を効果的に抑制した。
[RNA i活性を示した配列;規定配列部分、 オーバーハング部を含まない] 5, gacgccaaaaacataaaga (酉己列番号 1 5)
184, gttggcagaagctatgaaa (配列番号 1 6 )
272, gtgttgggcgcgttattta (配列番号 1 7 )
309, ccgcgaacgacatttataa (配列番号 1 8 )
428, ccaatcatccaaaaaatta (酉 3歹 U番号 1 9 )
515, cctcccggttttaatgaat (配列番号 20)
658, gcatgccagagatcctatt (配列番号 21)
695, ccggatactgcgattttaa (配列番号 22 )
734, ggttttggaatgtttacta (酉 S列番号 23 ) 774, gatttcgagtcgtcttaat (配列番号 24 )
891, gcactctgattgacaaata (酉列番号 25 )
904, caaatacgatttatctaat (配列番号 26 )
1186, gattatgtccggttatgta (配列番号 27)
1306, ccgcctgaagtctctgatt (配列番号 28 )
1586, ctcgacgcaagaaaaatca (酉己歹幡号 29)
[RNA i活性を示さなかった配列;規定配列部分、 オーバーハング部を含まな レ、]
14, aacataaagaaaggcccgg (酉己歹幡号 30 )
265, tatgccggtgttgggcgcg (配列番号 3 1 )
295, agttgcagttgcgcccgcg (酉 S歹 lj番号 32 )
411, acgtgcaaaaaaagctccc (酉己歹幡号 33)
1044, ttctgattacacccgaggg (酉 S列番号 34 )
[実施例 5 ]
SARSウィルスに対する s i RNAを設計し、 それらの RN A i活性を調べ た。 標的配列および評価対象の配列をそれぞれ変更する以外は、 RNA i活性は 上記実施例 2と同様のァッセィを行うことにより評価した。
s i RNAは、 SAR Sウィルスのゲノムから、 3CL - PR0、 RdRp、 Spike glycoprotein^ Small envelope E protein^ Membrane glycoprotein M、
Nucleocapsid protein, s2m motif の各所について、 上記 s i RNA酉己列設計プ 口グラムを用い所定の規則性に合致するものを設計した。
第 35図アツセィの結果、 規則性に合致するように設計した 1 1個の s i RN Aは、 それぞれ対応する s i RNAの配列をターゲットとして組み込んだ RN A を効果的に抑制した。 s i C o n t r o 1 (S AR Sとは関係のない配列) を入 れた場合を 1 00 %として、 S AR Sの各 s i RNAを入れた場合の相対標的 m RNA量を示す。 ,各 s i RNAを入れた場合、 標的の RNAが 1 0 %程度あるい はそれ以下まで減少しており、 RNA i活性があることが確認された。
[設計した s i RNAの配列 (規定配列部分、 オーバーハング部を含まない) ] siControl; gggcgcggtcggtaaagtt (IB歹 IJ番号 3 5 )
3CL- PRO; SARS- 10754; ggaattgccgtcttagata (配列番号 3 6 )
3CL-PR0; SARS- 10810; gaatggtcgtactatcctt (配列番号 3 7 )
RdRp; SARS- 14841; ccaagtaatcgttaacaat (配列番号 3 8 )
Spike glycoprotein; SARS - 23341; gcttggcgcatatattcta (配列番号 3 9 ) Spike glycoprotein; SARS-24375; cctttcgcgacttgataaa (配列番号 4 0 ) Small envelope E protein; SARS- 26233; gtgcgtactgctgcaatat (配列番号 4 1 )
Small envelope E protein; SARS- 26288; ctactcgcgtgttaaaaat (配列番号 4 2 )
Membrane glycoprotein M; SARS- 26399; gcagacaacggtactatta (配歹 lj番号 4 3 ) Membrane glycoprotein M; SARS - 27024; ccggtagcaacgacaatat (酉 El歹 lj番号 4 4 ) Nucleocapsid protein; SARS- 28685; cgtagtcgcggtaattcaa (酉己歹 fj番号 4 5 ) s2m motif ; SARS- 29606; gatcgagggtacagtgaat (酉 3列番号 4 6 )
[実施例 6 ]
上記 「< 5〉 s i R N A配列設計プログラム」 および 「< 7〉 s i R NA配列 設計プログラムを実行する塩基配列処理装置等」 に従って、 下記 s i R NAを設 計した。 設計された s i R N Aの配列を配列表の配列番号 4 7〜配列番号 8 9 2 に示す。
(R NA i対象遺伝子)
NM— 000604, Homo sapiens ribroblast growth iactor receptor 丄 (ims— related tyrosine kinase 2, Pfeiffer syndrome) (FGFR1) .
(標的配列)
匪— 000604- 807, gtagcaacgtggagttcat (酉 δ列番号 47)
匿一 000604 - 806, ggtagcaacgtggagttca (酉己列番号 48)
丽ー 000604- 811, caacgtggagttcatgtgt (配列番号 49)
丽_000604- 880, ggtgaatgggagcaagatt (配列番号 50)
丽— 000604- 891, gcaagattggcccagacaa (配列番号 51) (マウスのホモ口グに対しても有効な標的配列)
丽— 000604- 818, gagttcatgtgtaaggtgt (酉 S歹 ίΐ番号 52)
(R N A i対象遺伝子)
雇— 000141, Homo sapiens fibroblast growth factor receptor 2 (bacteria - expressed kinase, keratinocyte growth factor receptor, craniofacial dysostosis 1, Crouzon syndrome, Pfeiffer syndrome, Jackson-Weiss syndrome) (FGFR2) .
(標的配列)
丽— 000141- 612, gaggctacaaggtacgaaa (配列番号 53)
丽— 000141 - 615, gctacaaggtacgaaacca (配歹' J番号 54)
画一 000141-637, ctggagcctcattatggaa (配列番号 55)
NM_000141-574, gaaaaacgggaaggagttt (配列番号 56)
(マウスのホモ口グに対しても有効な標的配列)
丽—000141 - 595, gcaggagcatcgcattgga (酉己列番号 57)
NM_000141-69, ccttcagtttagttgagga (配列番号 58)
雇— 000141- 70, cttcagtttagttgaggat (配列番号 59)
(R Ai対象遺伝子)
丽— 000142, homo sapiens nbroblast growth factor receptor 3
(achondroplasia, thanatophoric dwarfism) (FGFR3) .
(標的配列)
雇— 000142- 899, gacggcacaccctacgtta (酉己歹 [J番号 60)
丽ー 000142- 1925, cacaacctcgactactaca (酉己列番号 61)
丽— 000142- 2154, gcacacacgacctgtacat (酉 3歹 [J番号 62)
厘—000142- 678, cctgcgtcgtggagaacaa (酉 S列番号 63)
丽—000142 -2157, cacacgacctgtacatgat (酉己列番号 64)
(マゥスのホモ口グに対-しても有効な標的配列) '
丽— 000142- 812, gagttccactgcaaggtgt (酉 3列番号 65)
(RNAi対象遺伝子) 厘— 004448, Homo sapiens v- erb- b2 erythroblastic leukemia viral oncogene homolog 2, neuro/ lioblastoma derived oncogene homolog (avian) (ERBB2) . (標的配列)
丽ー 004448-356, ggagacccgctgaacaata (配列番号 66)
NM_004448-3645, ccttcgacaacctctatta (酉己列番号 67)
丽— 004448-3237, gggctggctccgatgtatt (配列番号 68)
丽ー 004448-3238, ggctggctccgatgtattt (配列番号 69)
顧一 004448- 3240, ctggctccgatgtatttga (配列番号 70) (RNAi対象遺伝子)
丽— 001982, Homo sapiens v - erb - b2 erythroblastic leukemia viral oncogene homolog 3 (avian) (ERBB3) .
(標的配列)
雇— 001982- 1347, gtgctgggcgtatctatat (配列番号 71)
丽_001982- 1349, gctgggcgtatctatataa (配列番号 72)
丽— 001982-1548, gcttgtcctgtcgaaatta (酉 3列番号 73)
NM_001982-1549, cttgtcctgtcgaaattat (配列番吾 74)
丽ー 001982- 2857, cattcgeccaacctttaaa (配列番号 75)
(腿 i対象遺伝子)
匪— 005235, Homo sapiens v- erb— a erythroblastic leukemia viral oncogene homolog 4 (avian) (ERBB4) .
(標的配列)
厘— 005235- 295, ggagaatttacgcattatt (酉 3列番号 76)
應— 005235-2120, gctcaacttcgtattttga (酉 3歹 lj番号 77)
M_005235-2940, ctcaaagatacctagttat (Ϊ3列番号 78)
丽— 005235-2121, ctcaacttcgtattttgaa (配列番号 79)
丽ー 005235- 2880, ctgacagtagacctaaatt (酉 3列番号 80)
(RNAi対象遺伝子) 匪一 002227, Homo sapiens Janus kinase 1 a Orotem tyrosine kinaseノ (JAKl) .
(標的配列)
NM_002227-441, ctcagggacagtatgattt (配列番号 81)
丽— 002227- 1299, cagaatacgccatcaataa (酉 S歹 U番号 82)
丽ー 002227 - 673, gatgcggataaataatgtt (配列番号 83)
NM_002227-672, ggatgcggataaataatgt (配列番号
丽ー 002227- 3385, ctttcagaaccttattgaa (配列番号 85)
(マウスのホモ口グに対しても有効な標的配列)
匪— 002227- 607, cagctacaagcgatatatt (配列番号 86)
丽— 002227- 3042, caattgaaaccgataagga (配列番号 87)
丽— 002227- 2944, gggttctcggcaatacgtt (配列番号 88)
(RNAi対象遺伝子)
應一 004972, Homo sapiens Janus kinase 2 (a protein tyrosine kinase; (JAK2) .
(標的配列)
丽— 004972 - 2757, ctggtcggcgtaatctaaa (配列番号 89)
雇— 004972- 2759, ggtcggcgtaatctaaaat 列番号 90)
丽ー 004972- 2760, gtcggcgtaatctaaaatt (配列番号 91)
雇— 004972- 3175, ggaatttatgcgtatgatt (配列番号 92)
匪— 004972 - 1452, ctgttcgctcagacaatat (配列番号 93)
(マウスのホモ口グに対しても有効な標的配列)
NM_004972-872, ggaaacggtggaattcagt (配列番号
匿 _004972- 870, ctggaaacggtggaattca (酉 3列番号 95)
丽_004972- 847, gatttttgcaaccattata (配列番号 96)
(RNAi対象遺伝子)
丽— 000215, Homo sapiens Janus kinase 3 、a protein tyrosine kinase, leukocyte) ( JAK3) . (標的配列)
證ー 000215 - 2315, gtcattcgtgacctcaata (酉己列番号 97)
丽ー 000215- 2522, gacccgctagcccacaata (酉己列番号 98)
厘一 000215-2524, cccgctagcccacaataca (酉己列番号 99)
應— 000215-1788, ccatggtgcaggaatttgt (酉 S列番号 100)
NM_000215-1825, catgtatctgcgaaaacgt (酉 δ列番号 101)
(RNAi対象遺伝子)
丽一 003331, Homo sapiens tyrosine kinase 2 (TYK2) .
(標的配列)
麗— 003331- 3213, gcctgaaggagtataagtt (配列番号 102)
NM_003331-2658, cggaccctacggttttcca (配列番号 10¾ '
NM_003331-299, ctatatttccgcataaggt (配列番号 104)
(マウスのホモ口グに対しても有効な標的配列)
NM_003331-2674, ccacaagcgctatttgaaa (配列番号 105)
NM_003331-2675, cacaagcgctatttgaaaa (配列番号 10S)
醒ー 003331-328, gaactggcatggcatgaat (配列番号 107)
(RNAi対象遺伝子)
麗 _001079, Homo sapiens zeta - chain (TCR) associated protein kinase 70kDa
(ZAP70) .
(標的配列)
NM_001079-512, gaggccgagcgcaaacttt (配列番号 108)
NM_001079-1512, ggtacgcacccgaatgcat (酉己列番号 109)
NM_001079-242, gagctctgcgagttctact (配歹 (J番号 110)
丽— 001079- 929, gacacgagcgtgtatgaga (配列番号 111)
匿—001079- 1412, cggcactacgccaagatca (配列番号 112)
(マウスのホモログに対しても有効な標的配列)
丽ー 001079 - 1566, ggagctatggggtcaccat (酉 3列番号 113)
(RNAi対象遺伝子) NM_005417, Homo sapiens v-src sarcoma (Schmidt - Ruppin A - 2) viral oncogene homolog (avian) (SRC) .
(標的配列)
M_005417-185, ctgttcggaggcttcaact (配列番号 114)
丽ー 005417 - 685, ggtggcctactactccaaa (酉己列番号 115)
厘一 005417- 474, gggagtcagagcggttact (配列番号 116)
麗—005417-480, cagagcggttactgctcaa (酉 3列番号 117)
NM_005417-567, cagtgtctgacttcgacaa (配列番号 118)
(マウスのホモ口グに対しても有効な標的配列)
厘— 005417— 651, cctcccgcacccagttcaa (酉3歹 U番号 119)
(醒 i対象遺伝子)
NM_002350, Homo sapiens v - yes - 1 Yamaguchi sarcoma viral related oncogene homolog (LY ) .
(標的配列)
丽_002350- 610, cagcgacatgattaaacat (配列番号 120)
匪— 002350- 533, gttattaagcactacaaaa (酉己列番号 121)
匿— 002350- 606, gtatcagcgacatgattaa (配列番号 122)
(マウスのホモ口グに対しても有効な標的配列)
匪— 002350- 783, ggatgggttactataacaa (配列番号 123)
NM_002350-694, gaagccatgggataaagat (酉己列番号 124)
匪一 002350-541, gcactacaaaattagaagt (配列番号 125)
(RNAi対象遺伝子)
丽— 005157, Homo sapiens v—abl Abelson murine leukemia viral oncogene homolog 1 (ABL1) .
(標的配列)
NM_005157-232, cactctaagcataactaaa (配列番号 126)
應_005157- 770, gagggcgtgtggaagaaat (配列番号 127)
NM_005157-262, ccgggtcttaggctataat (配列番号 128) NM_005157-264, gggtcttaggctataatca (配列番号 129)
匿—005157- 484, catctcgctgagatacgaa (酉己列番号 130)
(マウスのホモ口グに対しても有効な標的配列)
雇— 005157- 217, ggccagtggagataacact (酉己列番号 131)
厘— 005157- 1227, gcctggcctacaacaagtt (配列番号 132)
丽ー 005157 - 680, gtgtcccccaactacgaca (配歹 U番号 133)
(RNAi対象遺伝子) ·
丽一 005158, Homo sapiens v-abl Aoelson murine leukemia viral oncogene homolog 2 (arg, Abel son-related gene) (ABL2) .
(標的配列)
丽— 005158- 3273, ctcaaactcgcaacaaatt (配列番号 134)
匪— 005158- 3272, cctcaaactcgcaacaaat (酉 3列番号 135)
NM_005158-1425, ctaaggtttatgaacttat (配列番号 136)
厘— 005158- 448, gctcagcagtctaatcaat (配歹 (J番号 137)
NM_005158-3110, caggccgctgagaaaatct (配列番号 138)
(RNAi対象遺伝子)
丽—004071, Homo sapiens CDC- like kinase 1 (CLKl) .
(標的配列)
丽_004071- 1215, ccaggaaacgtaaatattt (酉己列番号 139)
應— 004071-774, catttcgactggatcatat (配列番号 140)
丽ー 004071- 1216, caggaaacgtaaatatttt (酉 S列番号 141)
丽 .004071-973, ctttggtagtgcaacatat (酉 S列番号 142) .
丽— 004071 - 463, cgtactaagtgcaagatat (酉己歹 U番号 143)
(RNAi対象遺伝子)
M_001291, Homo sapiens CDC- like kinase 2 (CLK2) .
(標的配列)
丽— 001291- 202, gtatgaccggcgatactgt (配列番号 144)
丽— 001291-225, gctacagacgcaacgatta (酉己列番号 145) 雇— 001291- 226, ctacagacgcaacgattat (配列番号 146)
NM_001291-45, ggagttaccgtgaacacta (配列番号 I47)
匪一 001291- 46, gagttaccgtgaacactat (配列番号 148)
(RNAi対象遺伝子)
雇—001292, Homo sapiens CDC - like kinase 3 (CLK3) .
(標的配列)
匪— 001292-189, gccgtgacagcgatacata (酉 S列番号 149)
NM_001292-72, cctacagtcgggaacatga (配列番号 150)
雇一 001292-73, ctacagtcgggaacatgaa (配列番号 151)
NM_001292-188, cgccgtgacagcgatacat (配列番号 152)
麗一 001292- 121, gcctcccccacgaagatct (配列番号 153)
(マウスのホモ口グに対しても有効な標的配列)
NM_001292-388, ggtgaaggcacctttggca (配列番号 1δ4)
(RNAi対象遺伝子)
丽— 020666, Homo sapiens CDC- like kinase 4 (CLK4) .
(標的配列)
顧— 020666 - 617, gtattagagcacttaaata (酉 3列番号 155)
匪— 020666- 1212, gaaaacgcaagtattttca (配列番号 156)
匪一 020666- 1348, cctggttcgaagaatgtta (配列番号 157)
NM_020666-181, cttgaatgagcgagattat (配歹 ίΐ番号 158)
丽ー 020666- 803, cagatctgccagtcaataa (配歹 (J番号 159)
(マウスのホモログに対しても有効な標的配列)
画_020666 - 457, cgttctaagagcaagatat (配列番号 160)
匪— 020666- 446, caaagtggagacgttctaa (配列番号 161)
丽— 020666- 461, ctaagagcaagatatgaaa (配列番号 162)
(RNAi対象遺伝子)
匪— 002093, Homo sapiens glycogen synthase kinase 3 beta (GSK3B) .
(標的配列) M_002093-326, gtccgattgcgttatttct (配列番号 163) .
NM_002093-307, gctagatcactgtaacata (配列番号 Ι )
厘一 002093- 451, gacgctccctgtgatttat (配列番号 165)
M_002093-632, cccaatgtttcgtatatct (配列番号 166)
M_002093-623, cgaggagaacccaatgttt (配列番号 lW)
(マウスのホモ口グに対しても有効な標的配列)
應— 002093- 206, gtatatcaagccaaacttt (配列番号 168)
NM_002093-195, catttggtgtggtatatca (配列番号 I69)
丽ー 002093-205, ggtatatcaagccaaactt (配列番号 170)
(RNAi対象遺伝子)
應ー 182691, Homo sapiens SFRS protein kinase 2 (SRPK2) .
(標的配列)
魔— 182691- 1312, gccaaatggacgacataaa (配列番号 171)
匪— 182691- 1313, ccaaatggacgacataaaa (配列番号 172)
丽一 182691- 1314, caaatggacgacataaaat (配列番号 173)
醒— 182691- 1985, ctgatcccgatgttagaaa (配列番号 174)
匪— 182691- 233, ggccggtatcatgttatta (配列番号 175)
(RNAi対象遺伝子)
丽一 00o430, Homo sapiens wingless-type MMTV integration site family, member 1 (W T1) .
(標的配列)
蘭一 005430- 614, ggccgtacgaccgtattct (配列番号 176)
丽ー 005430 - 205, gcgtctgatacgccaaaat (酉己列番号 177)
NM_005430-855, cccacgacctcgtctactt (配列番号 178)
L005430- 196, caaacagcggcgtctgata (配列番号 179)
(マウスのホモ口グに対しても有効な標的配列)
丽—005430- 875, gagaaatcgcccaacttct (酉 S列番号 180)
藤— 005430-863, ctcgtctacttcgagaaat (配列番号 181) NM_005430-860, gacctcgtctacttcgaga (配列番号 182)
(RNAi対象遺伝子)
匿—003391, Homo sapiens wingless-type MMTV integration site family member
2 (WNT2) .
(標的配列)
丽— 003391- 111, gggtgatgtgcgataatgt (配列番号 183)
M_003391-681, ggaaaacgggcgattatct (配列番号 184)
NM_003391-764, gctaacgagaggtttaaga (配列番号 185)
丽_003391-765, ctaacgagaggtttaagaa (配列番号 186)
NM_003391-295, ggtcctactccgaagtagt (配列番号 187)
(マウスのホモ口グに対しても有効な標的配列)
NM_003391-797, gacctcgtgtattttgaga (配列番号 188)
匪— 003391-790, gaaaaatgacctcgtgtat (配列番号 189) - 厘—003391-789, cgaaaaatgacctcgtgta (配列番号 190)
(RNAi対象遺伝子)
丽— 004625, Homo sapiens wingless—type MMTV integration site family, member 7A (W T7A) .
(標的配列)
丽ー 004625- 92, ctgggcgcaagcatcatct (酉己列番号 191)
腿一 004625-313, gttcacctacgccatcatt (配列番号 192)
匪— 004625 - 524, gcccggactctcatgaact (配列番号 193)
丽一 004625- 480, gcttcgccaaggtctttgt (酉 3列番号 194)
(マウスのホモ口グに対しても有効な標的配列)
腿— 004625- 205, cctggacgagtgtcagttt (配列番号 195)
麗— 004625- 209, gacgagtgtcagtttcagt (配列番号 196)
M_004625-172, catcatcgtcataggagaa (配列番号 197)
(RNAi対象遺伝子) 丽一 004626, Homo sapiens wingless-type MMTV integration site family, member 11 (W T11) .
(標的配列)
腹—004626 - 543, gatcccaagccaataaact (配列番号 198)
NM_004626-917, gacagctgcgaccttatgt (配列番号 199)
醒— 004626- 915, gcgacagctgcgaccttat (配列番号 200)
丽—004626- 54, ccggcgtgtgctatggcat (配列番号 201)
(マウスのホモ口グに対しても有効な標的配列)
應— 004626- 59, gtgtgctatggcatcaagt (酉 3列番号 202)
丽_004626- 560, ctgatgcgtctacacaaca (酉 3列番号 203)
匪— 004626 - 562, gatgcgtctacacaacagt (配列番号 204)
(RNAi対象遺伝子)
NM_0307oo, Homo sapiens wingless-type MMTV integration site family, member 3 (丽 T3) .
(標的配列) ·
NM_030753-417, gctgtgactcgcatcataa (配列番号 20δ)
丽ー 030753- 483, ctgacttcggcgtgttagt (配列番号 206)
NM_030753-485, gacttcggcgtgttagtgt (配列番号 207)
(マウスのホモ口グに対しても有効な標的配列)
匿— 030753- 887, gaccggacttgcaatgtca (配列番号 208)
匿—030753- 56, ctcgctggctacccaattt (配列番号 209)
匿—030753- 59, gctggctacccaatttggt (配列番号 210)
(RNAi対象遺伝子)
丽_033丄 J1, Homo sapiens wingless-type MMTV integration site family, member 3A (W T3A) .
(標的配列)
匿—033131- 2, gccccactcggatacttct (配列番号 211)
雇—033131- 3, ccccactcggatacttctt (配列番号 212) NM_033131-4, cccactcggatacttctta (配歹 (J番号 213)
丽ー 03;3131-77, gctgttgggccacagtatt (配列番号 214)
丽— 033131 - 821, gaggcctcgcccaacttct (酉 3列番号 215)
(マウスのホモログに対しても有効な標的配列)
丽— 033131- 168, ggaactacgtggagatcat (配列番号 216)
NM_033131-50, ggcagctacccgatctggt (配列番号 217)
應—033131- 165, gcaggaactacgtggagat (配列番号 218)
(RNAi対象遺伝子)
應— 003392, Homo sapiens wingless-type MMTV integration site family, member 5A (W T5A) .
(標的配列)
丽ー 003392- 91, gtggtcgctaggtatgaat (配列番号 219)
丽— 003392- 93, ggtcgctaggtatgaataa (配列番号 220)
丽—003392 - 307, ggataacacctctgttttt (酉己列番号 221)
匪— 003392- 57, ccttcgcccaggttgtaat (酉 S列番号 222)
NM_003392-87, cttggtggtcgctaggtat (配列番号 223)
(マウスのホモ口グに対しても有効な標的配列)
匪— 003392- 163, ccaactggcaggactttct (配列番号 224)
丽_003392- 116, gttcagatgtcagaagtat (配列番号 225)
NM_003392-102, gtatgaataaccctgttca (配列番号226)
(RNAi対象遺伝子)
丽—004196, Homo sapiens cyclin - dependent kinase-like 1 (CDC2 - related kinase) (CDKLl) .
(標的配列)
匪—004196- 405, cgaaacattccgtgattaa (配列番号 227)
丽—004196- 305, ctcgtgaagagcataactt (配列番号 228)
丽— 004196- 458, ggaccgagtgactactata (配列番号 229)
丽_004196- 844, gttgcatcacccatatttt (配列番号 230) 丽—004196- 330, cactgcaagctgtaaattt (配列番号 231)
(マウスのホモ口グに対しても有効な標的配列)
腿— 004196-119, gatgaccctgtcataaaga (配列番号 232)
(RNAi対象遺伝子)
歷— 003948, Homo sapiens cyclin - dependent kinase- like 2 (CDC2-related kinase) (CDKL2) .
(標的配列)
NM_003948-623, gatcagctatatcatatta (配列番号 233)
丽— 003948-1379, ccatcaggcatttataaca (配列番号 234)
爾— 003948- 1380, catcaggcatttataacat (酉己列番号 235)
匪— 003948- 768, ctgaagtggtgatagattt (配列番号 236)
NM_003948-626, cagctatatcatattatga (配列番号 237)
(マウスのホモログに対しても有効な標的配列)
NM_003948-325, gattattaatggaattgga (配列番号 238) ' 丽ー 003948 - 1012, ggtacaggataccaatgct (配列番号 239)
(RNAi対象遺伝子)
丽— 016508, Homo sapiens cycl in-dependent kinase - like 3 (CDKL3) .
(標的配列)
NM一 016508- 498, gagctcccgaattagtatt (配列番号 240)
雇— 016508- 500, gctcccgaattagtattaa (配歹 [J番号 241)
腿— 016508- 1290, cacccatcaatctaactaa (酉己列番号 242)
匿— 016508- 1301, ctaactaacagtaatttga (配列番号 243)
腿— 016508-501, ctcccgaattagtattaaa (酉 S列番号 244)
(マウスのホモログに対しても有効な標的配列)
丽ー 016508- 785, gttcatgcttgtttacaaa (配列番号 245)
NM_016508-555, ctttgggctgtatgatcat (配列番号 246)
丽—016508- 776, gcagatatagttcatgctt (配列番号 247)
(RNAi対象遺伝子) 丽— 002745, Homo sapiens mitogen - activated protein kinase 1 (MAPKl) . (標的配列)
厘— 002745- 746, gaagacctgaattgtataa (酉己歹 Ij番号 248)
丽— 002745- 276, caaccatcgagcaaatgaa (酉己列番号 249)
匪— 002745- 849, ccaaagctctggacttatt (酉 S列番号 250)
匪—002745-749, gacctgaattgtataataa (酉 3列番号 251)
丽— 002745- 113, gtgtgctctgcttatgata (酉己列番号 252)
(マウスのホモ口グに対しても有効な標的配列)
NM_002745-220, cttactgcgcttcagacat (配列番号 253)
M_002745-228, gcttcagacatgagaacat (酉 3列番号 254)
匪一 002745- 224, ctgcgcttcagacatgaga (酉己列番号 255)
(RNAi対象遺伝子)
丽ー 016231, Homo sapiens nemo-like kinase (NLK) .
(標的配列)
匿— 016231- 450, gagtagcgctcaaaaagat (配列番号 256)
腿_016231_1074, gcgctaaggcacatatact (配列番号 257)
M_016231-962, ctactaggacgaagaatat (配列番号 258)
舰一 016231- 579, ctccacacattgactattt (配列番号 259)
(マウスのホモ口グに対しても有効な標的配列)
NM_016231-703, gattttgcgaggtttgaaa (酉己歹 Ij番号 260)
丽ー 016231- 1382, gtccgacaggttaaagaaa (酉 3列番号 261)
NM_016231-1384, ccgacaggttaaagaaatt (配列番号 262)
(RNAi対象遺伝子)
丽— 001315, Homo sapiens mitogen - activated protein kinase 14 (MAPK14) . (標的配列)
丽— 001315- 401, ctccgaggtctaaagtata (酉己列番号 263)
NM_001315-403, ccgaggtctaaagtatata (酉己列番号 264)
歷_001315- 251, ggtctgttggacgttttta (酉己列番号 265) NM_001315-212, ctgcggttacttaaacata (配列番号 266)
丽ー 001315 - 405, gaggtctaaagtatataca (酉己歹 U番号 267)
(マウスのホモ口グに対しても有効な標的配列)
NM_001315-664, gtttcctggtacagaccat (配列番号 268)
(RNAi対象遺伝子)
丽一 002751, Homo sapiens mitogen - activated protein kinase 11 (MAPKll) .
(標的配列) .
麗— 002751- -366, gcgacgagcacgttcaatt (配列番号 269)
丽—002751- -667, cccgggaagcgactacatt (配列番号 270)
丽— 002751- -669, cgggaagcgactacattga (配列番 271)
丽— 002751- -731, gaggttctggcaaaaatct (配列番号 272)
丽ー 002751- -729, ctgaggttctggcaaaaat (配列番号 273)
(RNAi対象遺伝子)
NM— 002969, Homo sapiens mitogen - activated protein kinase 12 (MAPK12) . (標的配列)
M—002969- 1018, gaagcgtgttacttacaaa (酉 S列番号 274)
NM_002969-262, gctgctggacgtattcact (配列番号 275)
應_002969_1017, ggaagcgtgttacttacaa (酉 3列番号 276)
NM_002969-578, cccgaggtcatcttgaatt (配列番号 21T)
丽— 002969-1013, gaatggaagcgtgttactt (酉己列番号 278)
(RNAi対象遺伝子)
丽一 002754, Homo sapiens mitogen - activated protein kinase 13 (MAPK13) . (標的配列)
丽_002754- 164, ctgagccgaccctttcagt (配列番号 279)
匿— 002754- 174, cctttcagtccgagatctt (酉 3列番号 280)
匿一 002754- 978, ccttagaacacgagaaact (配列番号 281)
NM_002754-285, ccctgcgcaacttctatga (配列番号 282)
匪一 002754 - 287, ctgcgcaacttctatgact (配歹 ϋ番号 283) (RNAi対象遺伝子)
丽— 139049, Homo sapiens mitogen-activated protein kinase 8 (MAPK8) . (標的配列)
画一 139049- 449, gacttaaagcccagtaata (配列番号 284)
NM_139049-213, gagagctagttcttatgaa (酉己列番号 2δ5)
NM_139049-451, cttaaagcccagtaatata (配列番号 286)
(マウスのホモ口グに対しても有効な標的配列)
NM_139049-525, caggaacgagttttatgat (配列番号 287)
NM_139049-524, gcaggaacgagttttatga (配列番号 288)
丽—139049- 283, gaaatccctagaagaattt (酉己列番号 289)
(RNAi対象遺伝子)
丽一 002752, Homo sapiens mitogen - activated protein kinase 9 (MAPK9j .
(標的配列) '
丽ー 002752- 116, gtttgtgctgcatttgata (配列番号 290)
匪— 002752- 204, gagcttatcgtgaacttgt (酉 3歹 lj番号 291)
(マウスのホモログに対しても有効な標的配列) '
NM_002752-878, gccagagatctgttatcaa (配列番号292)
M_002752-879, ccagagatctgttatcaaa (配列番号 293)
NM_002752-880, cagagatctgttatcaaaa (配列番号 294)
(RNAi対象遺伝子)
丽— 002753, Homo sapiens mitogen-activated protein kinase 10 (MAPKIO) .
(標的配列)
M_002753-668, gtggtgacacgttattaca (酉 S列番号 295)
腿—002753- 957, cggactccgagcacaataa (配列番号 296)
NM_002753-958, ggactccgagcacaataaa (配列番号 29ァ)
丽_002753- 811, gtggaataaggtaattgaa (配歹 U番号 298)
丽— 002753- 1212, ctaaaaatggtgtagtaaa (酉 S列番号 299)
(マウスのホモログに対しても有効な標的配列) 丽—002753- 1167, ggaaagaacttatctacaa (酉 S列番号 300) NM_002753-584, gtagtcaagtctgattgca (酉 S歹 U番号 301)
丽— 002753- 761, gaaatggttcgccacaaaa (配列番号 302)
(RNAi対象遺伝子)
丽— 001786, Homo sapiens cell division cycle 2, Gl to S and G2 to M (CDC2) .
(標的配列)
雇— 001786 - 782, gatttgctctcgaaaatgt (配列番号 303) '
丽— 001786- 788, ctctcgaaaatgttaatct (配列番号 304)
丽— 001786- 658, gggcactcccaataatgaa (配列番号 305)
NM_001786-696, ctttacaggactataagaa (配列番号 306)
NM_001786-562, gagtataggcaccatattt (配列番号 307)
(マウスのホモ口グに対しても有効な標的配列)
厘— 001786- 869, gacaatcagattaagaaga (配列番号 308)
(RNAi対象遺伝子)
丽— 001798, Homo sapiens cycl in - dependent kinase 2 (CDK2) - (標的配列)
NM_001798-224, ctctacctggtttttgaat (配列番号 309)
NM_001798-690, cttctatgcctgattacaa (配列番号 310)
M_001798-770, gatggacggagcttgttat (酉 3列番号 311)
NM_001798-226, ctacctggtttttgaattt (配列番号 312)
匪— 001798 - 36, gcacgtacggagttgtgta (酉己列番号 313)
(RNAi対象遺伝子)
應ー 000075, Homo sapiens cycl in-dependent kinase 4 (CDK4) .
(標的配列)
NM_000075-45, cctatgggacagtgtacaa (配列番号 314)
NM_000075-616, gatgtttcgtcgaaagcct (配列番号 315)
匿 _000075- 161, cgtgaggtggctttactga (酉己列番号 316) 腿一 000075- 35, ggtgtcggtgcctatggga (配列番号 317)
NM_000075-242, cgaactgaccgggagatca (酉 S列番号 318)
(RNAi対象遺伝子)
匿— 052984, Homo sapiens cycl in-dependent kinase 4. (CDK4) , transcript variant 2, mRNA. , 228. . 563, 0
(標的配列)
匪— 052984-248, gaccgggagatcaagagat (配列番号 319)
丽_052984- 251, cgggagatcaagagatgtt (酉 S歹 fj番号 320)
(RNAi対象遺伝子)
匿— 001799, Homo sapiens cycl in-dependent kinase 7 (M015 homo log, Xenopus 丄 aevis, cdk- activating kinase) (CDK7) .
(標的配列)
丽— 001799- 242, ggacataaatctaatatta (配列番号 321)
匿— 001799- 104, caaattgtcgccattaaga (配列番号 322)
丽—001799- 490, ccccaatagagcttataca (配列番号 323)
NM_001799-20, cgggcaaagcgttatgaga (配列番号 324)
NM_001799-21, gggcaaagcgttatgagaa (配歹 lj番号 325)
(マウスのホモログに対しても有効な標的配列)
麗— 001799- 345, cctacatgttgatgactct (配列番号 326)
(RNAi対象遺伝子)
丽—000455, Homo sapiens serine/ threonine kinase 11 (Peutz-Jegners syndrome) (STK11) .
(標的配列)
NM_000455-306, ggaggttacggcacaaaaa (配列番号 327)
丽— 000455- 307, gaggttacggcacaaaaat (配列番号 328)
爾一 000455- 309, ggttacggcacaaaaatgt (配列番号 329)
丽— 000455- 1157, cccaaggccgtgtgtatga (配列番号 330)
匿一 000455- 1158, ccaaggccgtgtgtatgaa (酉 S列番吾 331) (マウスのホモ口グに対しても有効な標的配列)
画— 000455- 916, cagctggttccggaagaaa (配列番号 332)
(RNAi対象遺伝子)
丽一 001274, Homo sapiens CHKl checkpoint homolog (S. pombe) (CHEK1) . (標的配列)
NM_001274-456, cagtatttcggtataataa (配列番号 333)
NM_001274-361, gcatggtattggaataact (配列番号 334)
應ー 001274- 990, gcccctcatacattgataa (配列番号 335)
NM_001274-1038, ccacatgtcctgatcatat (配列番号 336)
NM_001274-227, ggcaatatccaatatttat (配列番号 337)
(マウスのホモログに対しても有効な標的配列)
匪— 001274- 573, ggtcctgtggaatagtact (配列番号 338)
丽ー 001274- 416, gaaagggataacctcaaaa (配列番号 339)
丽ー 001274 - 577, ctgtggaatagtacttact (配列番号 340)
(RNAi対象遺伝子)
丽一 002648, Homo sapiens pim-l oncogene (PIM1) .
(標的配列)
丽ー 002648- 831, ggccaaccttcgaagaaat (酉 B列番号 341)
丽ー 002648-601, cgatgggacccgagtgtat (配列番号 342)
匪一 002648- 602, gatgggacccgagtgtata (配列番号 343)
丽ー 002648- 293, ggtttctccggcgtcatta (配列番号 344)
腿一 002648- 834, caaccttcgaagaaatcca ®S列番号 345)
(マゥスのホモ口グに対しても有効な標的配列)
腿一 002648- 96, ccctggagtcgcagtacca (配列番号 346)
麗一 002648- 203, gtggagaaggaccggattt (配列番号 347)
(RNAi対象遺伝子)
匿一 006875, Homo sapiens pim- 2 oncogene (PIM2) .
(標的配列) 丽—006875- 698, ggggacattccctttgaga (配列番号 348)
雇— 006875- 242, ctcgaagtcgcactgctat (配列番号 349)
丽ー 006875- 245, gaagtcgcactgctatgga (配列番号 350)
丽ー 006875- 499, gaacatcctgatagaccta (配列番号 351)
丽_006875- 468, gtggagttgtccatcgtga (配列番号 352)
(腿 i対象遺伝子)
丽— 021643, Homo sapiens tribbles homolog 2 (TRB2)
(標的配列)
NM_021643-174, cttgtatcgggaaatactt (配列番号 353)
NM_021643-71, gaagagttgtcgtctataa (配列番号 354) M_021643-177, gtatcgggaaatacttatt (配列番号 355)
麗— 021643- 524, ctcaagctgcggaaattca (配歹 (J番号 356)
(マウスのホモ口グに対しても有効な標的配列)
M_021643-41, gggagatcgcggaacaaaa (配列番号 357)
M_021643-382, gttctttgagcgaagctat (配列番号 358)
NM_021643-143, cccgagactccgaacttgt (配列番号 359)
(匪 i対象遺伝子) 匪一 007118, Homo sapiens triple functional domain (PTPRF interacting) (TRIO) .
(標的配列)
匿— 007118-1684, caccaatgcggataaatta (酉己列番号 360)
丽— 007118- 1686, ccaatgcggataaattact (酉 3列番号 361)
NM_007118-3857, gaaatctacgaatttcata (配列番号 362)
NM_007118-6395, gagcagatcgtcatattca (酉己列番号 363)
丽ー 007118- 8531, cctatccgtagcattaaaa (配列番号 364)
(腿 i対象遺伝子) 丽— 004938, Homo sapiens death-associated protein kinase 1 (DAPKl) .
(標的配列)
NM_004938-917, caatccgttcgcttgatat (配列番号 36δ)
匿一 004938- 1701, ggtgtttcgtcgattatca (配列番号 366)
丽ー 004938- 1702, gtgtttcgtcgattatcaa (配列番号 367)
NM_004938-2824, gaaggtacttcgaaatcat (配列番号 368)
NM_004938-668, gaaacgttagcaaatgtat (配列番号 369)
(マウスのホモ口グに対しても有効な標的配列)
丽— 004938- 609, gggtaataacctatatcct (配列番号 370)
厘— 004938- 2697, gaggcgagtttggatatga (配列番号 371)
M_004938-490, ggcccataaaattgacttt (配列番号 372)
(RNAi対象遺伝子)
丽— 006252, Homo sapiens protein Kinase, AMP— activated, alpha 2 catalytic subunit (PRKAA2) .
(標的配列)
醒ー 006252- 760, gaaacgagcaactatcaaa (配列番号 373)
NM_006252-148, gaagattcgcagtttagat (配列番号 374)
NM— 006252- 1227, gcaaaccgtatgacattat (配列番号 375)
NM_006252-1338, ctggcaattacgtgaaaat (配列番号 376)
丽ー 006252- 1340, ggcaattacgtgaaaatga (配列番号 377)
(腿 i対象遺伝子) ,
匪— 002742, Homo sapiens protein kinase C, mu (PRKCM) .
(標的配列) '
雇— 002742- 508, ggtacgtcaaggtcttaaa (配列番号 378)
N—002742- 1332, gattggatagcaaatgtat (配歹 ί!番号 379)
應—002742- 509, gtacgtcaaggtcttaaat (酉 3列番号 380)
M_002742-370, ggaaggcgatcttattgaa (酉 3列番号 381)
(マゥスのホモ口グに対しても有効な標的配列) NM_002742-1913, caccctggtgttgtaaatt (配列番号 382)
厘—002742- 2041, cataacgaagtttttaatt (配列番号 383)
NM_002742-2521, ctatcagacctggttagat (配列番号.384)
(RNAi対象遺伝子)
匪— 003684, Homo sapiens MAP kinase - interacting serine/threonine kinase 1 (MKNKl) .
(標的配列)
NM_003684-218, gagtatgccgtcaaaatca (配列番号 385)
NM_003684-229, caaaatcatcgagaaacaa (配列番号 386)
丽ー 003684- 344, gatgacacaaggttttact (配列番号 387)
NM_003684-192, gtgccgtgagcctacagaa (配列番号 388)
丽— 003684- 379, gcaaggaggttccatctta (酉 S列番号 389)
(RNAi対象遺伝子)
丽一 004759, Homo sapiens mitogen— activated protein kinase— activated protein kinase 2 (MAPKAPK2) .
(標的配列)
NM_004759-942, ccatcaccgagtttatgaa (配列番号 390)
NM_004759-836, cgaatgggccagtatgaat (配列番号 3Θ1)
丽—004759 - 563, cctgagaatctcttataca (配列番号 392)
NM_004759-669, gttatacaccgtactatgt (配列番号 393)
NM_004759-362, gatgtgtacgagaatctgt (配列番号 394)
(RNAi対象遺伝子)
應— 172171, Homo sapiens calcium/calmodul in-dependent protein kinase (し aM kinase) II gamma (CAMK2G) .
(標的配列)
丽_172171 - 113, gagtacgcagcaaaaatca (酉己列番号 395)
NM_172171-422, ctgctgctggcgagtaaat (配列番号 396) 丽ー 172171 - 1075, ggtacacaacgctacagat (配列番号 397)
丽ー 172171- 474, gcctagccatcgaagtaca (配列番号 398)
(マウスのホモ口グに対しても有効な標的配列)
NM_172171-425, ctgctggcgagtaaatgca (配列番号 399)
NM_172171-260, ctcgtgtttgaccttgtta (配列番号 400)
丽ー 172171- 597, gcggggtcatcctgtatat (配列番号 401)
(RNAi対象遺伝子)
丽ー 015981, Homo sapiens calcium/calmodul in-dependent protein kinase (CaM kinase) II alpha (CAMK2A) .
(標的配列)
NM_015981-1213, ccatcgattctattttgaa (配列番号 402)
丽—015981- 1210, cttccatcgattctatttt (配列番号 03)
丽ー 015981- 1067, cggaaacaggaaattataa (配列番号 404)
NM_015981-1066, gcggaaacaggaaattata (配列番号 40δ)
M_015981-754, gaccattaacccatccaaa (配列番号 46)
(マゥスのホモ口グに対しても有効な標的配列)
丽—015981- 1130, gagtcctacacgaagatgt (酉 3列番号 407)
腿一 015981- 1416, ggcagatcgtccacttcca (配列番号 08)
匪一 015981-1418, cagatcgtccacttccaca (酉 S列番号 409)
(RNAi対象遺伝子)
丽ー020439, Homo sapiens calcium/calmodu丄 in- dependent protein kinase IG
(CAMK1G) .
(標的配列)
應ー 020439- 1354, ggtcatggtaccagttaaa (酉 S列番号 410)
NM_020439-1409, ggagtctgtctcattatgt (酉 S列番号 411)
麗ー 020439- 639, gtggataccccccattcta (配列番号 412)
丽— 020439- 823, ctggattgacggaaacaca (酉 S列番号 413)
NM_020439-662, gaaacggagtctaagcttt (酉 S列番号 14)■ (マウスのホモ口グに対しても有効な標的配列)
丽ー 020439- 85, gggatcaggagctttctca (配列番号 415)
丽ー 020439 - 903, gcaagtggaggcaagcctt (配列番号 416)
(斷対象遺伝子)
匿— 007194' Homo sapiens CHK2 checkpoint homolog (S. pombe) (CHEK2) . (標的配列)
NM_007194-460, ctcttacattgcatacata (配列番号 41ァ)
NM_007194-201, ctcaggaactctattctat (配列番号 41δ)
ΝΜ_007194-1233, gtttaggagttattctttt (配列番号 419) ' 丽— 007194- 398, gataaataccgaacataca (配列番号 420)
丽—007194- 396, cagataaataccgaacata (酉 3列番号 421)
(マゥスのホモ口グに対しても有効な標的配列)
NM_007194-614, gtagatgatcagtcagttt (配列番号 422)
M_007194-620, gatcagtcagtttatccta (配列番号 423)
丽—007194- 612, ctgtagatgatcagtcagt (酉己列番号 424)
(R Ai対象遺伝子)
丽— 002610, Homo sapiens pyruvate dehydrogenase kinase, isoenzyme 1 (PDK1) .
(標的配列)
腿— 002610- 1194, gactcccagtgtataacaa (酉 3列番号 425)
丽一 002610- 553, catgagtcgcatttcaatt (酉 S列番号 426)
匪— 002610- 306, ggacaccatccgttcaatt (配列番号 427)
NM_002610-1086, gtctttacgcacaatactt (配列番号 428)
NM_002610-388, ggatgctaaagctatttat (配列番号 429)
(RNAi対象遺伝子)
丽ー001619, Homo sapiens adrenergic, beta, receptor kinase 1 (ADRBK1) . (標的配列)
丽ー 001619- 474, gggacgtgttccagaaatt (配列番号 430) 麗ー 001619 - 317, gagatcttcgactcataca (配列番号 431)
丽—001619 - 665, gacaaaaagcgcatcaaga (酉己歹 IJ番号 432)
賺—001619- 439, gccatacatcgaagagatt (酉己歹 fj番号 433)
NM_001619-476, gacgtgttccagaaattca (酉己列番号 4:34)
(マウスのホモ口グに対しても有効な標的配列)
丽— 001619- 1476, caaaaggaatcaagttact (酉 S列番号 435)
麗—001619- 1474, cacaaaaggaatcaagtta (酉己列番号 36)
麗_001619- 1171, ccggcagcacaagaccaaa (酉:!列 ¾ "号 437)
(RNAi対象遺伝子)
雇— 005160, Homo sapiens adrenergic, beta, receptor kinase 2 (ADRBK2) . (標的配列)
NM_005160-1779, gagagtcccggcaaaattt (配列番号 438)
NM_005160-1778, ggagagtcccggcaaaatt (配列番号 439)
瓶— 005160- 1373, cagcatgtctacttacaaa (酉己歹 lj番号 440)
丽— 005160 - 307, cagaagtcgacaaatttat (配列番号 441)
雇— 005160-306, gcagaagtcgacaaattta (酉 3歹 [J番号 442)
(RNAi対象遺伝子)
M— 003161, Homo sapiens ribosomal protein S6 kinase, 70kDa, polypeptide 1 (RPS6KB1) .
(標的配列)
NM_003161-1294, ccgatcacctcgaagattt (配列番号 443)
腿—003161- 1556, cacctgcgtatgaatctat (配列番号 444)
NM_003161-1296, gatcacctcgaagatttat (配列番号 δ)
應— 003161- 831, gtttgggagcattaatgta (配列番号 446)
匪— 003161- 1295, cgatcacctcgaagattta (配列番号 447)
(RNAi対象遺伝子)
NM— 014496, Homo sapiens ribosomal protein S6 kinase, 90kDa, polypeptide 6 (RPS6KA6) . (標的配列)
丽— 014496- 682, gaaggcttactcattttgt (配列番号 448)
丽— 014496 - 1552, ggaggctagtgatatacta (酉己歹 U番号 49)
丽_014496 - 1553, gaggctagtgatatactat (配歹 ί]番号 50)
NM_014496-1551, gggaggctagtgatatact (酉 B列番号 451)
丽— 014496-1481, cttgttacggatttaatga (配歹 U番号 452) '
(マウスのホモ口グに対しても有効な標的配列)
歷— 014496- 831, gaaatgagaccatgaatat (酉 3列番号 453) NM_014496-1411, gatgcgctatggacaacat (配列番号 454)
匪一 014496-927, ggaatccagcaaatagatt (酉 3列番号 455)
(腿 i対象遺伝子)
NM_0029DJ, Homo sapiens ribosomal protein S6 kinase, 90kDa, polypeptide
(RPS6KA1) .
(標的配列)
丽ー 002953- 739, ctatggggtgttgatgttt (酉 S列番号 456)
麗ー 002953- 1331, gctgtcaaggtcattgata (酉 3歹 U番号 457)
濯一 002953- 1'332, ctgtcaaggtcattgataa (酉己歹 fj番号 458)
麵ー 002953- 735, ggtcctatggggtgttgat (配列番号 459)
NM一 002953- 738, cctatggggtgttgatgtt (配列番号 60)
(マウスのホモ口グに対しても有効な標的配列)
丽ー 002953- 666, gcgggacagtggagtacat (酉 3列番号 461)
醒ー 002953 - 832, gctaggcatgccccagttt (配列番号 462)
匪一 002953- 1315, caccaacatggagtatgct (酉 3列番号 463)
(RNAi対象遺伝子)
NM一 001626, Homo sapiens v~akt murine thymoma vira丄 oncogene homoiog 2
(AKT2) .
(標的配列) , 丽— 001626- 141, ctctaccccccttaaacaa (配列番号 464)
丽ー 001626-35, cacaagcgtggtgaataca (配列番号 465)
丽— 001626- 143, ctaccccccttaaacaact (配歹 (1番号 466)
M_001626-41, cgtggtgaatacatcaaga (配列番号 467)
NM_001626-420, gcaaggcacgggctaaagt (酉 3歹 (J番号 468)
(醒対象遺伝子)
丽— 005163, Homo sapiens v— akて murine Onymonia viral oncogene homolo^ 丄 (AKTl) .
(標的配列)
NM_005163-1294, gactgacaccaggtatttt (配列番号 469)
NM_005163-1296, ctgacaccaggtattttga (酉己列番号 470)
匪— 005163- 1292, gagactgacaccaggtatt (配列番号 471)
匪— 005163- 751, cttctatggcgctgagatt (配歹 (J番号 472)
M— 005163- 630, cagccctgaagtactcttt (配列番号 473)
(RNAi対象遺伝子)
Nk— 005465, Homo sapiens v-akt murine thymoma viral oncogene homolog 3
(protein kinase B, gamma) (AKT3) .
(標的配列)
丽_005465- 229, ccagtggactactgttata (配列番号 474)
丽— 005465- 99, cattcataggatataaaga (酉 S列番号 475)
NM_005465-402, cctctacaacccatcataa (配列番号 476)
應_005465- 1283, gagacagatactagatatt (配列番号 477)
(マウスのホモログに対しても有効な標的酉己列)
丽ー 005465- 733, ggaccgcacacgtttctat (酉 S列番号 478)
丽— 005465- 1317, cagctcagactattacaat (酉 3列番号 479)
應— 005465- 1319, gctcagactattacaataa (酉 S列番号 480)
(RNAi対象遺伝子)
丽一 005627, Homo sapiens serum/ glucocorticoid regulated kinase (SGK) . (標的配列)
丽— 005627- 875, ggcctgccgcctttttata (酉 B列番号 481)
NM_005627-97, gggtctgaacgactttatt (配列番号 482)
NM_005627-99, gtctgaacgactttattca (配列番号 483)
匪— 005627- 190, ggagcctgagcttatgaat (配列番号 484)
應— 005627-413, gaggagaagcatattatgt (配列番号 485)
(マウスのホモ口グに対しても有効な標的配列)
M_005627-649, catcgtttatagagactta (配列番号 486)
丽ー 005627-367, ctatgcagtcaaagtttta (酉 3列番号 487)
雇一 005627- 307, gatcggaaagggcagtttt (配列番号 4δ8)
(RNAi対象遺伝子)
NM一 170693, Homo sapiens serum/ glucocorticoid regulated kinase 2 (SGK2) . (標的配列)
NM_170693-163, gtctgatggggcgttctat (配列番号 489)
丽— 170693- 840, cagactttcttgagattaa (配列番号 490)
丽ー 170693- 842, gactttcttgagattaaga (配列番号 491)
匪— 1了0693- 5δ2, gtggtacccctgagtactt (配列番号 492)
丽ー 170693- 183, cagtgaaggtactacagaa (配歹 tl番号 93)
(マウスのホモ口グに対しても有効な標的配列)
匪 _170693_287, gtgggcctgcgctactcct (酉己歹 lj番号 94)
(RNAi対象遺伝子)
丽— 0132ο , Homo sapiens serum/ glucocorticoid regulated kinase- like (SGKL) .
(標的配列)
丽ー 013257 - 273, caggactaaacgaattcat (配列番号 495)
腿一 013257- 944, gacaccactaccacatttt (配列番号 496)
匿一 013257- 1388, gtatcttctgactattcta (配列番号 497)
丽ー 013257- 946, caccactaccacattttgt (配列番号 498) 歷ー 013257- 790, gttttacgctgctgaaatt (酉 3列番号 499)
(マゥスのホモ口グに対しても有効な標的配列)
瓶—013257- 693, caactgaaaagctttattt (酉 S列番号 500) 丽— 013257 - 225, gaatatttggtgataattt (酉己列番号 501)
NM_013257-38, ccaagtgtaagcattccca (配列番号 δθ2)
(腿 i対象遺伝子)
厘—002744, Homo sapiens protein kinase C, zeta (PRKCZ) . (標的配列)
NM_002744-1233, gcggaaccccgaattacat (配列番号 δθ3) 厘— 002744- 398, caagccaagcgctttaaca (酉 3列番号 504) 丽—002744- 1447, caaagcctcccatgtttta (配列番号 505) 丽—002744- 823, ccaaatttacgccatgaaa (酉己列番号 506) 醒_002744- 1100, cacgagagggggatcatct (配列番号 507)
(RNAi対象遺伝子)
匪—006254, Homo sapiens protein kinase C, delta (PRKCD) . (標的配列)
NM_006254-1524, gcggcacccctgactatat (配列番号 δθδ) NM_006254-1339, ctaccgtgccacgttttat (配列番号 509) 丽ー 006254 - 992, gggacctacggcaagatct (配列番号 510)
(マゥスのホモ口グに対しても有効な標的配列)
丽— 006254 - 172, gttcgacgcccacatctat (酉己列番号 511) 匪— 006254- 659, cagaaagaacgcttcaaca (配列番号 512) 匪 _006254- 761, gtgaagcagggattaaagt (配列番号 513)
(RNAi対象遺伝子)
匪一 002737, Homo sapiens protein kinase C, alpha (PRKCA) . (標的配列)
NM_002737-1571, ggcgtcctgttgtatgaaa (配列番号 δ14) 顧— 002737- 393, gtgacacctgcgatatgaa (配列番号 515) NM_002737-711, gacgactgtctgtagaaat (配列番号 516)
NM_002737-1085, gaactgtatgcaatcaaaa (配列番号 51ァ)
丽— 002737- 1924, gctggttattgctaacata (配列番号 518)
(マウスのホモ口グに対しても有効な標的配列)
M_002737-1958, gaagggttctcgtatgtca (配列番号 519)
丽— 002737- 1835, ccattcaagcccaaagtgt (酉 S列番号 520)
NM—002737- 1234, gctgtacttcgtcatggaa (配列番号 521)
(RNAi対象遺伝子)
匿— 002738, Homo sapiens protein kinase C, beta 1 (PRKCBl) .
(標的配列)
腿—002738- 573, cagatccctacgtaaaact (配列番号 522)
匪一 002738- 1791, catttttccggtatattga (配列番号 523)
M_002738-1384, catttaccgtgacctaaaa (配列番号 524)
NM_002738-575, gatccctacgtaaaactga (配歹 [J番号 525)
NM_002738-1315, ggagccccatgctgtattt (配列番号 526)
(マゥスのホモ口グに対しても有効な標的配列)
NM_002738-1006, gatgaaactgaccgatttt (配列番号 527)
NM_002738-1961, gaattcgaaggattttcct (配列番号 528)
醒ー 002738- 1233, ccatggaccgcctgtactt (酉 S列番号 529)
(RNAi対象遺伝子)
麗ー 015282, Homo sapiens cytoplasmic linker associated protein 1 (CLASP 1) . (標的配列)
丽_015282- 2447, gagccgtatgggatgtatt (配列番号 530)
NM_015282-4151, gccgagctgacgattatga (配列番号 531)
NM_015282-4152, ccgagctgacgattatgaa (配歹 U番号 532)
丽_015282- 1786, gcgatctcgaagtgatatt (酉 3列番号 533)
NM_015282-635, cagtcccggttgaatgtaa (配列番号 534)
(RNAi対象遺伝子) NM— 006287, Homo sapiens tissue factor pathway inhibitor (lipoprotein- associated coagulation inhibitor) (TFPI) .
'(標的配列)
丽ー 006287- 225, ctcgacagtgcgaagaatt (配列番号 535)
NM_006287-227, cgacagtgcgaagaattta (配列番号 5;36)
NM_006287-228, gacagtgcgaagaatttat (配列番号 5:37)
NM_006287-230, cagtgcgaagaatttatat (配列番号 538)
NM_006287-393, gaatatgtcgaggttatat (配列番号 539)
(RNAi対象遺伝子)
匪— 004073, Homo sapiens cytokine-inducible kinase (CNK) .
(標的配列)
厘—004073- 1283, gttgactactccaataagt (配列番号 540)
雇一 004073- 138, gcgcctacgctgtcaaagt (配列番号 541)
NM_004073-239, cgccacatcgtgcgttttt (配列番号 542)
丽—004073- 1281, gggttgactactccaataa (酉 3列番号 543)
(マウスのホモ口グに対しても有効な標的配列)
NM_004073-192, gcgagaagatcctaaatga (配列番号 544)
丽ー 004073- 183, cgcatcagcgcgagaagat (配列番号 545) NM_004073-190, gcgcgagaagatcctaaat (配歹 lj番号 546)
(RNAi対象遺伝子)
丽一 003384, Homo sapiens vaccinia related kinase 1 (VRKl) .
(標的配列)
+匪— 003384 - 776, ccttgggaggataatttga (配列番号 547)
匪— 003384-773, cttccttgggaggataatt (配列番号 548)
匪一 003384- 195, caccttgtgttgtaaaagt (配列番号 549) 厘— 003384- 777, cttgggaggataatttgaa (配列番号 550) (マウスのホモ口グに対しても有効な標的配列)
NM_003384-372, gttacaggtttatgataat (配列番号 551)
NM_003384-463, gcagctaagcttaagaatt (配列番号 5 )
NM_003384-977, ggactaaaagctataggaa (配列番号 553)
(R Ai対象遺伝子)
匪— 006296, Homo sapiens vaccinia related kinase 2 (VRK2) .
(標的配列)
NM_006296-366, gactaggaatagatttaca (配列番号 5¾)
厘— 006296- 165, caagacatgtagtaaaagt (配列番号 555)
NM_006296-874, ggtatgtgctcatagttta (配列番号 556)
NM_006296-541, ggtttatcttgcagattat (配列番号 ¾7) .
丽— 006296- 113, ggatttggattgatatatt (配列番号 558)
(マウスのホモ口グに対しても有効な標的配列)
丽_006296- 560, ggactttcctacagatatt (配歹【j番号 559)
雇一 006296- 626, cataatgggacaatagagt (配列番号 560) ' 圈—006296- 568, ctacagatattgtcccaat (配列番号 561)
(RNAi対象遺伝子)
丽— 004672, Homo sapiens mitogen-activated protein kinase kinase Kinase 6
(MAP3K6) .
(標的配列)
NM_004672-2221, ctttctcctccgaactttt (配列番号 562)
NM_004672-1489, gatgttggagtttgattat (酉 3列番号 563)
NM_004672-814, caaagagctccggctaata (配列番号 564)
NM_004672-51, ccctgcgggaggatgtttt (配列番号 δδδ)
厘一 004672 - 503, gccgagcagcataatgtct (配列番号 566)
(マウスのホモ口グに対しても有効な標的配列)
丽ー 004672 - 442, ggactactcggccatcatt (配列番号 567)
丽_004672- 277, ctatttccgggagaccatt (酉 S列番号 568) NM_004672-1929, ggctgctcaagatttctga (配列番号 569)
(RNAi対象遺伝子)
丽一 005923, Homo sapiens mitogen - activated protein kinase kinase kinase 5 (MAP3K5) .
(標的配列)
厘一 005923- 3294, gatccactgaccgaaaaat (酉 3列番号 570)
應ー 005923- 838, caggaaagctcgtaattta (配歹 !j番号 571)
NM_005923-840, ggaaagctcgtaatttata (配歹【j番号 572)
匿一 005923 1525, gtacctcaagtctattgta (配列番号 573)
丽ー 005923 - 2517, ctggtaccctccagtatat (配列番号 574)
(RNAi対象遺伝子)
匪— 020998, Homo sapiens macrophage stimulating 1 (hepatocyte growth factor-like) (MST1) .
(標的配列)
NM_020998-943, ccgatttacgccagaaaaa (配列番号 575)
NM_020998-944, cgatttacgccagaaaaat (配歹 (J番号 576)
丽—020998-945, gatttacgccagaaaaata (配列番号 577)
NM— 020998- 698, ggtctggacgacaactatt (配歹' j番号 578)
丽ー 020998- 1827, ccaaaggtacgggtaatga (配歹 U番号 579)
(RNAi対象遺伝子)
丽— 003576, Homo sapiens serine/ threonine kinase 24 (STE20 homo丄 og, yeast)
(STK24) .
(標的配列)
丽ー 003576- 348, gctccgcactagatctatt (配歹 [J番号 580)
丽ー 003576- 349, ctccgcactagatctatta (配列番号 581)
丽— 003576- 351, ccgcactagatctattaga (配列番号 582)
丽— 003576- 352, cgcactagatctattagaa (配列番号 583)
M_003576-437, ctccattcggagaagaaaa (配列番号 584) (マウスのホモ口グに対しても有効な標的配列)
丽_003576- 148, gttcaaaggcattgacaat (酉己列番号 585)
(匪 i対象遺伝子)
丽ー 016542, Homo sapiens Mst3 and S0K1- related kinase (MST4) .
(標的配列)
顧— 016542- 857, ctgatagatcgttttaaga (配列番号 586)
NM_016542-139, gcaagtcgttgctattaaa (配列番号 58ァ)
NM_016542-1133, gaagaactcgagaaaagta (配列番号 588)
麗_016542- 556, ggctcctgaagttattcaa (酉 3列番号 589)
(マウスのホモ口グに対しても有効な標的配列)
丽— 016542- 613, gggaattactgctattgaa (酉 B列番号 590)
應—016542- 669, caatgagagttctgtttct (酉 3列番号 591)
丽_016542 - 1063, gataatcacacctgcattt (配列番号 592)
(RNAi対象遺伝子)
NM— 002576, Homo sapiens p21/Cdc42/Racl— activated kinase 1 (STE20 homolog: yeast) (PAK1) .
(標的配列)
NM_002576-38, gcccctccgatgagaaata (配列番号 593)
丽_002576- 788, ggcgatcctaagaagaaat (配列番号 594)
雇—002576- 3, caaataacggcctagacat (配列番号 595)
丽—002576- 154, ccgattttaccgatccatt (配列番号 596)
(マウスのホモ口グに対しても有効な標的配列)
M_002576-1020, gggttgttatggaatactt (配列番号 597)
匿—002576- 1165, catcaagagtgacaatatt (配列番号 598)
匿一 002576- 1015, gctgtgggttgttatggaa (配列番号 599)
(RNAi対象遺伝子)
丽— 002577, Homo sapiens p21 (CDK 1A) -activated kinase 2 (PAK2) .
(標的配列) NM_002577-721, cataggtgaccctaagaaa (配列番号 δΟΟ) 丽— 002577- 908, cccaacatcgttaactttt (酉 3列番号 601)
丽— 002577- 909, ccaacatcgttaacttttt (配列番号 602)
丽— 002577- 557, ccggatcatacgaaatcaa (配列番号 603)
匪—002577- 558, cggatcatacgaaatcaat (配列番号 604)
(腿 i対象遺伝子)
雇— 002578, Homo sapiens p21 (CDKNIA) - activated kinase 3 (PAK3) .
(標的配列)
讓ー 002578-458, catccttcgagtacaaaaa (配列番号 605)
醒— 002578- 1467, ctgtattccgtgacttttt (配列番号 606)
NM_002578-1469, gtattccgtgactttttaa (配列番号 607)
雇— 002578- 706, cacagatcggcaaagaaaa (配列番号 608)
雇— 002578- 3, ctgacggtctggataatga (配歹 [J番号 609)
(マウスのホモログに対しても有効な標的配列)
丽_002578- 1376, cccccttaccttaatgaaa (配列番号 610)
丽— 002578- 219, cagactttgagcatacgat (酉 S列番号 611)
丽—002578— 254, gcagtcaccggggaattca (配列番号 612)
(腿 i対象遺伝子)
丽_005884, Homo sapiens p21 (CDKNIA) - activated kinase 4 (PAK4) . (標的配列)
丽— 005884- 1502, gggataatggtgattgaga (配列番号 613)
雇 _005884- 1503, ggataatggtgattgagat (配列番号 614)
匪— 005884- 883, gccacagcgagtatcccat (配列番号 615)
NM_005884-77, cagcacgagcagaagttca (配列番号 616)
匪— 005884- 1494, ggtcgctggggataatggt (配列番号 617)
(RNAi対象遺伝子)
N— 002755, Homo sapiens mitogen— activated protein kinase kinase 1 (MAP2K1) . (標的配列)
匿 _002755- 280, ggccagaaagctaattcat (配列番号 618)
NM_002755-402, gcgatggcgagatcagtat (配列番号 619)
匿— 002755- 404, gatggcgagatcagtatct (配列番号 620)
丽— 002755- 682, ctacatgtcgccagaaaga (配列番号 621)
匿— 002755- 1128, ccaccatcggccttaacca (配歹 lj番号 622)
(マゥスのホモ口グに対しても有効な標的配列)
NM_002755-912, gacctcccatggcaatttt (配列番号 623)
NM_002755-915, ctcccatggcaatttttga (配列番号 624)
NM_002755-911, cgacctcccatggcaattt (配歹 U番号625)
(RNAi対象遺伝子)
丽—030662, Homo sapiens mitogen- activated protein kinase kinase 2 (MAP2K2) .
(標的配列)
匿— 030662- 1136, gccggctggttgtgtaaaa (配列番号 626)
丽ー 030662- 184, caaggtcggcgaactcaaa (酉 3列番号 627)
NM_030662-959, ctcctggactatattgtga (配列番号 628)
匪— 030662- 183, ccaaggtcggcgaactcaa (配歹 lj番号 629)
丽—030662- 711, ggttgcagggcacacatta (酉 3列番号 630) .
(RNAi対象遺伝子)
匪—002756, Homo sapiens mitogen- activated protein kinase kinase 3
(MAP2K3) .
(標的配列)
厘一 002756- 257, cgcacggtcgactgtttct (配列番号 631)
雇— 002756- 258, gcacggtcgactgtttcta (配列番号 632)
NM_002756-289, ctacggggcactattcaga (配列番号 633)
NM_002756-285, ccttctacggggcactatt (配列番号 634)
NM_002756-44, gactcccggaccttcatca (配列番号 635) (マウスのホモログに対しても有効な標的配列)
NM_002756-129, gagcctatggggtggtaga (酉己列番号 636)
丽— 002756 - 41, ctggactcccggaccttca (配列番号 637)
NM_002756-89, gaggctgatgacttggtga (配列番号 638)
(R Ai対象遺伝子)
雇— 002758, Homo sapiens mitogen- activated protein kinase kinase 6 (MAP2K6) .
(標的配列)
丽— 002758- 394, ggatacatcactagataaa (酉 S列番号 639)
丽ー 002758 - 395, gatacatcactagataaat (配列番号 640)
匪— 002758- 755, cttcgatttccctatgatt (Κί列番号 641)
丽— 002758 340, cttttatggcgcactgttt (S3列番号 642)
NM_002758-399, catcactagataaattcta (酉己列番号 643)
(マウスのホモ口グに対しても有効な標的配列)
NM— 002758- 312, ggacggtggactgtccatt (酉己列番号 644)
丽— 002758-418, caaacaagttattgataaa (配列番号 645)
丽— 002758 - 415, ctacaaacaagttattgat (酉 3列番号 646)
(RNAi対象遺伝子)
NM—003010, Homo sapiens mitogen - activated protein kinase kinase 4 (MAP2K4) .
(標的配列)
NM_003010-543, ctacctcgtttgataagtt (酉 3列番号 647)
丽— 003010- 1130, gcatgctatgtttgtaaaa (酉 S列番号 648)
丽— 003010- 1056, ccaaaaggccaaagtataa (酉己列番号 649)
(マウスのホモログに対しても有効な標的配列)
匪— 003010- 1129, cgcatgctatgtttgtaaa (酉 S列番号 650)
丽—003010 1057, caaaaggccaaagtataaa (配列番号 651)
丽ー 003010- 452, gtaatgcggagtagtgatt (酉己列番号 652) (RNAi対象遺伝子)
NM_016123, Homo sapiens interleukin - 1 receptor - associated kinase 4 (IRAK4) .
(標的配列)
NM_016123-1299, gccaatgtcggcatgaaaa (配列番号 653)
NM_016123-1073, gctttgcgtggagaaataa (配列番号 654)
NM_016123-38, ctcaatgttggactaatta (配列番号 6¾)
NM_016123-769, cctctgcttagtatatgtt (配列番号 656)
M_016123-1180, gttattgctagatattaaa (配列番号 657)
(RNAi対象遺伝子)
應— 002880, Homo sapiens v_raf- 1 murine leukemia viral oncogene homo log (RAF1) .
(標的配列)
NM_002880-1703, gatcttagtaagctatata (酉 S列番号 658)
醒— 002880- 232, gcatgactgccttatgaaa (配列番号 659)
丽ー 002880- 1597, ctatggcatcgtattgtat (酉 S歹 U番号 660)
雇一 002880- 1706, cttagtaagctatataaga (配列番号 661)
雇_002880- 568, cagacaactcttattgttt (配列番号 662)
(RNAi対象遺伝子)
NM_000020, Homo sapiens activin A receptor type II- like 1 (ACVRLl) . (標的配列)
厘— 000020- 1453, caagaagacactacaaaaa (配列番号 663)
NM_000020-722, gagactgagatctataaca (配列番号 664)
厘— 000020- 1456, gaagacactacaaaaaatt (配列番号 665)
醒ー 000020- 728, gagatctataacacagtat (配列番号 666)
NM_000020-846, gctccctctacgactttct (配列番号 667)
(RNAi対象遺伝子) 丽— 001105, Homo sapiens activin A receptor, type I (ACVRl) . (標的配列)
雇—001105-1456, cacagcactgcgtatcaaa (配列番号 668)
NM_001105-428, gttgctctccgaaaattta (配列番号 669) " 匪— 001105- 431, gctctccgaaaatttaaaa (酉 3列番号 670)
丽—001105-1460, gcactgcgtatcaaaaaga (酉己列番号 671)
NM_001105-1458, cagcactgcgtatcaaaaa (配列番号 672)
(マゥスのホモ口グに対しても有効な標的配列)
丽— 001105- 1306, caatgacccaagttttgaa (配列番号 673)
NM_001105-1381, gttctcagacccgacatta (配列番号674)
匪—001105-281, caaggggactggtgtaaca (酉 3列番号 675)
(腿 i対象遺伝子) '
厘一 004302, Homo sapiens activin A receptor, type IB (ACVRIB) .
(標的配列)
應 _004302- 609, cccgaaccatcgttttaca (配列番号 676)
匪— 004302-610, ccgaaccatcgttttacaa (酉己列番号 677)
匪一 004302- 897, caattgaggggatgattaa (配列番号 678)
丽—004302- 857, cacgggtccctgtttgatt (配列番号 679)
NM_004302-859, cgggtccctgtttgattat (配列番号 680)
(マウスのホモ口グに対しても有効な標的配列)
丽— 004302- 1119, gggtggggaccaaacgata (酉 3列番号 681)
NM_004302-1063, cctggctgtccgtcatgat (酉 3列番号 682)
厘— 004302- 1121, gtggggaccaaacgataca (配列番号 683)
(RNAi対象遺伝子)
顧一 145259, Homo sapiens activin A receptor, type IC (ACVRIC) . (標的配列)
NM_145259-1419, ctgctcttcgtattaagaa (配列番号 684)
丽— 145259- 956, gctcatcgagacataaaat (配歹 ί|番号 685) NM_145259-825, gctccttatatgactattt (配列番号 686)
厘— 145259- 959, catcgagacataaaatcaa (配列番号 687)
NM_145259-1237, gtaccaattgccttattat (配列番号 688)
(腿 i対象遺伝子)
丽ー 004ο丄 2, Homo sapiens transforming growth factor, beta receptor I (activin A receptor type II - like kinase, 53kDa) (TGFBRl) .
(標的配列)
NM_004612-236, cgagataggccgtttgtat (配列番号 689)
NM_004612-1451, gcattgcggattaagaaaa (配列番号 690)
NM_004612-463, ccatcgagtgccaaatgaa (配列番号 6Θ1)
NM_004612-492, cattagatcgcccttttat (配歹 (J番号 692)
丽— 004612-1449, cagcattgcggattaagaa (酉 3列番号 693)
(マウスのホモ口グに対しても有効な標的配列)
丽ー 004612- 829, gttggtgtcagattatcat (配列番号 694)
匪— 004612-288, caacatattgctgcaatca (酉 S列番号 695)
醒ー 004612- 839, gattatcatgagcatggat (配列番号 696)
(RNAi対象遺伝子)
應ー 00483り, Homo sapiens eukaryotic translation initiation factor 2 - alpha kinase 3 (EIF2AK3) .
(標的配列)
M_004836-1594, catagcaacaacgtttatt (配列番号 697)
NM_004836-1419, catatgataatggttatta (配列番号 69δ)
NM_004836-1900, ggtaatgcgagaagttaaa (配列番号 6")
丽ー 004836- 1248, ctaatgaaaacgcaattat (酉 S列番号 700)
(マウスのホモログに対しても有効な標的配列)
丽ー 004836- 784, ctttgaacttcggtatatt (酉 3列番号 701)
M_004836-782, cactttgaacttcggtata (配列番号 702)
NM_004836-983, gaatgggagtaccagtttt (配列番号 703) (腿 i対象遺伝子)
麗一 001433, Homo sapiens ER to nucleus signalling 1 (ERNl) .
(標的配列)
NM_001433-2407, cattgcacgagaattgata (配列番号 704)
NM_001433-2277, caggctgcgtcttttacta (配列番号7 O5)
NM_001433-2530, cgtgagcgacagaatagaa (配列番号 706)
麗— 001433- 1149, ccaaacatcgggaaaatgt (配列番号 707)
NM_001433-364, ggacatctggtatgttatt (酉 3列番号 708)
(マウスのホモ口グに対しても有効な標的配列)
NM_001433-319, cccatgccgaagttcagat (配列番号 709)
M_001433-2254, ctacacggtggacatcttt (配列番号 710)
匪—001433- 324, gccgaagttcagatggaat (酉 3列番号 711)
(腿 i対象遺伝子)
丽— 001278, homo sapiens conserved helix— loop-helix ubiquitous kinase (CHUK) .
(標的配列)
應— 001278- 746, ggagaagttcggtttagta (配列番号 712)
NM_001278-1879, ggccctcagtaatatcaaa (配列番号ァ1:3)
NM_001278-864, gacctgttgaccttacttt (配列番号 714)
匪— 001278- 2150, ggccatttaagcactatta (酉 S列番号 715)
NM_001278-2151, gccatttaagcactattat (配列番号 716)
(マウスのホモ口グに対しても有効な標的配列)
M_001278-645, ctggatataggcctttttt (配列番号 717)
丽_001278- 1354, gttaagtcttcttagatat (配列番号 718)
丽—001278- 1203, gtttatctgattgtgtaaa (配列番号 719)
(脆 i対象遺伝子)
NM_014002, Homo sapiens inhibitor of kappa light polypeptide gene enhancer in B— cells, kinase epsilon (IKBKE) . (標的配列)
NM_014002-2107, catcgaacggctaaataga (酉 S列番号 720)
厘— 014002- 1724, ctggataaggtgaatttca (配列番号 721)
M_014002-535, cctgcatcccgacatgtat (配列番号 722)
丽ー 014002- 1220, ctgcaggcggattacaaca (酉己列番号 723)
NM_014002-1726, ggataaggtgaatttcagt (配列番号 724)
(マウスのホモ口グに対しても有効な標的配列)
腿 _014002- 54, ccactgccagtgtgtacaa (酉 S列番号 725)
(RNAi対象遺伝子)
麗— 003177, Homo sapiens spleen tyrosine kinase (SYK) .
(標的配列)
NM_003177-1222, caatgaccccgctcttaaa (配列番号 726)
NM_003177-713, cagctagtcgagcattatt (配列番号 Ί2Ί、
NM_003177-849, ggtcagcgggtggaataat (配列番号 728)
丽_003177- 715, gctagtcgagcattattct (配列番号 729)
M_003177-1389, gacatgtcaaggataagaa (配歹 !j番号 730)
(マウスのホモ口グに対しても有効な標的酉己列)
' 丽—003177- 1559, gctgatgaaaactactaca (配列番号 731)
丽ー 003177- 1028, gacacagaggtgtacgaga (配列番号 732)
NM_003177-1560, ctgatgaaaactactacaa (配列番号 733)
(RNAi対象遺伝子)
應— 153831, Homo sapiens PTK2 protein tyrosine kinase 2 (PTK2) .
(標的配列) .
NM_153831-451, gaagagcgattatatgtta (配列番号 734)
し 153831-1889, gtaatcggtcgaattgaaa (配列番号 735)
NM_153831-93, caatggagcgagtattaaa (配列番号 736)
丽_153831- 2747, ctggaccggtcgaatgata (配列番号 737)
醒— 153831- 92, gcaatggagcgagtattaa (配列番号 738) (マウスのホモ口グに対しても有効な標的配列)
M_153831-1767, ctccagagtcaatcaattt (酉己列番号 7:39)
腿— 153831- 1766, gctccagagtcaatcaatt (酉 a列番号 740)
匿— 153831- 599, gttggtttaaagcgatttt (配列番号 741)
(匪 i対象遺伝子)
雇— 173174, Homo sapiens PTK2B protein tyrosine kinase 2 beta (PTK2B)
(標的配列)
丽— 173174- 1273, ggtcctgaatcgtattctt (酉 3列番号 742)
麗— 173174-1776, ccccagagtccattaactt (酉己歹 U番号 743)
丽— 173174- 1723, ggacgaggactattacaaa (配列番号 744)
丽ー 173174- 2486, gaccccatggtttatatga (配列番号 745)
(マウスのホモ口グに対しても有効な標的配列)
NM_173174-378, ggaggtatgaccttcaaat (配列番号 746)
丽— 173174 - 1182, gcagcatagagtcagacat (酉己列番号 747)
匪— 173174- 376, gtggaggtatgaccttcaa (配列番号 748)
(匪 i対象遺伝子)
裏一 002944, Homo sapiens v - ros UR2 sarcoma virus oncogene .homolog 1 (avian) (R0S1) .
(標的配列)
丽—002944 - 417, gaagctggacttatactaa (酉己列番号 749) 雇— 002944- 2123, gacatggattggtataaca (配列番号 750)
NM—002944- 2163, cgaaaggcgacgtttttgt (配列番号 751)
N¾L002944-1385, caagccaagcgaatcattt (配列番号 752)
雇—002944- 416, ggaagctggacttatacta (配列番号 753)
(マウスのホモ口グに対しても有効な標的配列)
NM_002944-3048, ctgtcactccttataccta (配列番号 754)
NM_002944-3044, ctttctgtcactccttata (配列番号 755) NM_002944-1051, caacatgtctgatgtatct (配列番号 756)
(腿 i対象遺伝子)
NM_004304, Homo sapiens anaplastic lymphoma kinase (Ki-1) (ALK) .
(標的配列)
匪— 004304 - 2469, ccacctacgtatttaagat (配列番号 757)
匪—004304 - 4067, cctgtataccggataatga (配歹 lj番号 758)
丽— 004304- 2468, gccacctacgtatttaaga (配歹 (j番号 759)
NM_004304-4183, cgctttgccgatagaatat (配列番号 760)
丽一 004304- 2922, gccacggggaagtgaatat (酉己列番号 761)
(マウスのホモログに対しても有効な標的配列)
NM_004304~3258, ccatcatgaccgactacaa (配列番号 762)
NM_004304-2833, caatgaccccgaaatggat (配列番号 763)
丽ー 004304- 3156, ccggcatcatgattgtgta (配歹 U番号 764)
(匪 i対象遺伝子)
丽一 000245, Homo sapiens met proto - oncogene (hepatocyte growth iactor receptor) (MET) .
(標的配列)
丽一 000245- 2761, gaacagcgagctaaatata (配列番号ァ65)
丽—000245- 1271, cagcgcgttgacttattca (酉 S列番号 766)
匪— 000245- 1086, gtgcattccctatcaaata (配列番号 767)
匪一 000245- 725, gattcttaccccattaagt (配歹 [(番号 768)
NM_000245-3619, caaagcgatgaaatatctt (配列番号 769)
(マウスのホモ口グに対しても有効な標的配列)
層一 000245- 2987, catttggataggcttgtaa (配歹 lj番号 770)
丽— 000245-801, ctctagatgctcagacttt (配列番号 771)
雇—000245- 2660, gttaaaggtgaagtgttaa (配列番号 772)
(RNAi対象遺伝子) NM一 002529, Homo sapiens neurotrophic tyrosine kinase, receptor, type 1 (NTRK1) .
(標的配列)
NM_002529-2091, gcatcctgtaccgtaagtt (酉己列番号 773)
丽ー 002529 - 345, ggctcagtcgcctgaatct (配列番号 774)
NM_002529-347, ctcagtcgcctgaatctct (配列番号 775)
NM_002529-953, ggctccgtgctcaatgaga (配列番号 776)
丽ー 002529-1987, ggtcaagattggtgatttt (配列番号 777)
(脆 i対象遺伝子)
腿一 006180, Homo sapiens neurotrophic tyrosine kinase, receptor, type 2 (NTRK2) .
(標的配列)
丽ー 006180-358, caattttacccgaaacaaa (配列番号 778)
NM_006180-1642, catcaagcgacataacatt (配列番号 ΊΊ9、
丽— 006180- 663, gtgatccggttcctaatat (配列番号 780)
雇一 006180- 665, gatccggttcctaatatgt (配列番号 781)
NM_006180-792, cttgtgtggcggaaaatct (配列番号 782)
(マウスのホモ口グに対しても有効な標的配列)
NM_006180-562, cctgcagatacccaattgt (配列番号 783)
NM_006180-898, ctggtgcattccattcact (配列番号 784)
NM— 006180- 735, cacagggctccttaaggat (配列番号 785)
(RNAi対象遺伝子)
雇一 000208, Homo sapiens insulin receptor (INSR) .
(標的配列)
NM_000208-2562, gccctgtgacgcatgaaat (配列番号 786)
NM_000208-2565, ctgtgacgcatgaaatctt (配列番号 787)
NM_000208-3492, gcatggtcgcccatgattt (酉己列番号 788)
謹- 000208-3493, catggtcgcccatgatttt (配列番号 789) M_000208-329, ggatcacgactgttcttta (配列番号 790)
(マウスのホモログに対しても有効な標的配列)
丽— 000208-2911, gattggaagtatttatcta (酉 δ歹 U番号 791)
丽—000208- 902, caccaatacgtcattcaca (配列番号 792)
NM_000208-1514, cggacatcttttgacaaga (配歹 U番号 793)
(RNAi対象遺伝子)
丽_000323, Homo sapiens ret proto— oncogene ^multiple endocrine neoplasia and medullary thyroid carcinoma 1, Hirschsprung disease) (RET) .
(標的配列)
NM_000323-2679, gcttgtcccgagatgttta (配歹 IJ番号 794)
NM_000323-3066, catctgactccctgattta (配歹 lj番号 795)
NM— 000323- 3069, ctgactccctgatttatga (配列番号 796)
應_000323- 2680, cttgtcccgagatgtttat (配列番号 797)
丽_000323- 2728, gggtcggattccagttaaa (配列番号 798)
(マウスのホモ口グに対しても有効な標的配列)
匿— 000323-3159, ccacatggattgaaaacaa (配列番号 799)
丽—000323 - 3156, cttccacatggattgaaaa (配列番号 800)
NM_000323-3155, ccttccacatggattgaaa (配歹 []番号 801)
(RNAi対象遺伝子)
丽— 006293, Homo sapiens TYR03 protein tyrosine kinase (TYR03) .
(標的配列) '
NM_006293-1494, gcatcagcgatgaactaaa (配歹' J番号 802)
醒— 006293- 2207, gaaaacgctgagatttaca (酉 3歹 ij番号 803)
丽— 006293- 2394, gccaggaccccttatacat (配列番号 804)
丽—006293- 2399, gaccccttatacatcaaca (配列番号 805)
腿_006293_1493, ggcatcagcgatgaactaa (配列番号 806)
(RNAi対象遺伝子)
丽ー 182925, Homo sapiens fms - related tyrosine kinase 4 (FLT4) . (標的配列)
NM_182925-758, gtgtgggctgagtttaact (酉己列番号 807)
NM_182925-756, ccgtgtgggctgagtttaa (配列番号 808)
厘— 182925- 1217, ggcctgaggcgcaacatca (酉 S列番号 809)
匪— 182925- 1827, gcaagaacgtgcatctgtt (酉 B列番号 810)
NM_182925-908, gacctgggctcgtatgtgt (配列番号 811)
(マウスのホモ口グに対しても有効な標的配列)
NM_182925-2033, cggctcacgcagaacttga (配列番号 8
NM_182925-330, gctactacaagtacatcaa (配列番号 813)
(RNAi対象遺伝子) 匿一 004119, Homo sapiens fms - related tyrosine kinase 3 (FLT3) . (標的配列)
M_004119-1569, gtgagacgatccttttaaa (配列番号 δ14)
ΝΜ_004119-2490, gattggctcgagatatcat (酉己列番号 815)
NM_004119-1571, gagacgatccttttaaact (配列番号 δΐδ)
匪一 004119- 32, ccgctgctcgttgtttttt (配列番号 817)
NM_004119-730, gttcacaatagatctaaat (配列番号 818)
(マウスのホモ口グに対しても有効な標的配列)
丽— 004119-92, gtgatcaagtgtgttttaa (配列番号 819)
厘— 004119- 1483, ggtgtcgagcagtactcta (配列番号 820)
匿一 004119-1456, ggctaacagaaaagtgttt (配列番号 821)
(匪 i対象遺伝子)
丽一 002253, Homo sapiens kinase insert domain receptor (a type丄 II receptor tyrosine kinase) (KDR) .
(標的配列)
丽ー 002253- 617, gaaagttaccagtctatta (酉己列番号 822)
丽ー 002253- 865, gagcaccttaactatagat (配歹リ番号 823) NM_002253-2020, gaatcagacgacaagtatt (配列番号 824)
雇—002253- 815, gtaaaccgagacctaaaaa (酉己列番号 825)
丽—002253-2586, ggacagtagcagtcaaaat (酉 3列番号 826)
(マウスのホモ口グに対しても有効な標的配列)
NM_002253-3032, gtggctaagggcatggagt (配列番号 827)
丽_002253- 3627, ccaaattccattatgacaa (配列番号 828)
匪—002253-3626, cccaaattccattatgaca (配列番号 829)
(脆 i対象遺伝子)
丽一 002609, Homo sapiens platelet - aerivea growth factor receptor, beta polypeptide (PDGFRB) .
(標的配列)
丽— 002609- 961, ggtgggcacactacaattt (配列番号 830)
丽— 002609- 2881, gttgggcgaaggttacaaa (酉 S列番号 831)
NM_002609-409, ctttctcacggaaataact (配列番号 832)
醒— 002609- 278, gacacgggagaatactttt (配列番号 833)
NM_002609-3048, gtgacaacgactatatcat (配列番号 834)
(マウスのホモ口グに対しても有効な標的配列)
NM_002609-633, catccatcaacgtctctgt (配列番号 835)
匪— 002609- 2784, cctccgacgagatctatga (酉 3列番号 836)
(RNAi対象遺伝子)
匪— 005433, Homo sapiens v_yes- 1 Yamaguchi sarcoma viral oncogene homolog
1 (YES1) .
(標的配列)
M_005433-525, gaaatcaacgaggtatttt (配列番号 837)
丽_005433- 670, cacaaccagagcacaattt (配列番号 838)
丽_005433- 1333, gtatggtcggtttacaata (配列番号 839)
匪 _005433- 1331, ctgtatggtcggtttacaa (配列番号 840)
匪— 005433- 416, ggttatatcccgagcaatt (酉 S列番号 841) (マウスのホモログに対しても有効な標的配列)
匪 _005433- 953, caagaagctcagataatga (配列番号 842)
NM_005433-1, gggctgcattaaaagtaaa (配列番号 843)
雇一 005433- 4, ctgcattaaaagtaaagaa (配列番号 844)
(RNAi対象遺伝子)
匪一 002005, Homo sapiens feline sarcoma oncogene (FES) .
(標的配列)
匿— 002005- 1696, gattggacgggggaacttt (酉 3列番号 845)
NM_002005-2181, cacctgaggcccttaacta (酉 3列番号 846)
NM_002005-1553, ggctttcctagcattcctt (酉己列番号 847)
丽—002005- 683, gaatacctggagattagca (酉 S列番号 848)
雇— 002005- 74, ctactggagggcatgagaa (配列番号 849)
(RNAi対象遺伝子)
應_000633, Homo sapiens B- cell CLL/lymphoma 2 (BCL2) .
(標的配列) '
丽ー 000633-43, gatgaagtacatccattat (配列番号 850)
歷_000633- 41, gtgatgaagtacatccatt (配列番号 851)
(マウスのホモ口グに対しても有効な標的配列)
NM_000633-452, gagttcggtggggtcatgt (配列番号 85¾
匿一 000633-454, gttcggtggggtcatgtgt (配列番号 853)
丽_000633- 525, ggatgactgagtacctgaa (配列番号 854)
(RNAi対象遺伝子)
匪— 001167, Homo sapiens baculoviral IAP repeat-containing 4 (BIRC4) . (標的配列)
匪一 001167- 302, gccacgcagtctecaaatt (配列番号 855) .
匪 _001167- 794, gaagcacggatctttactt (酉 δ列番号 856)
丽ー 001167 - 485, gaagaagctagattaaagt (配歹 IJ番号 857)
雇一 001167- 402, cacatgcagactatctttt (酉 B列番号 858) (マウスのホモ口グに対しても有効な標的配列)
丽— 001167- 71, gaagagtttaatagattaa (配列番号 859)
NM_001167-68, gtagaagagtttaatagat (配列番号 860)
丽ー 001167- 1354, ctgtatggatagaaatatt (配列番号 861)
(R Ai対象遺伝子)
丽一 139317, Homo sapiens baculoviral IAP repeat-containing 7 (livin) (BIRC7) .
(標的配列)
NM_139317-458, ctgctccggtcaaaaggaa (配列番号 862)
應ー 139317- 457, cctgctccggtcaaaagga (配列番号 863)
匿 _139317 - 743, gagaggacgtgcaaggtgt (配列番号 864)
NM_139317-774, ccgtgtccatcgtctttgt (配列番号 865)
NM_139317-417, cctggacggagcatgccaa (配列番号 866)
(RNAi対象遺伝子)
丽— 005036, Homo sapiens peroxisome proliferative activated receptor, alpha (PPARA) .
(標的配列)
丽ー 005036 - 922, gctaaaatacggagtttat (配列番号 867)
NM_005036-1243, ccacccggacgatatcttt (配列番号 868)
NM_005036-711, cttttgtcatacatgatat (酉 S列番号 869)
匪— 005036 - 498, cacacaacgcgattcgttt (配列番号 870)
匪— 005036-988, gctggtagcgtatggaaat (配列番号 871)
(RNAi対象遺伝子)
麗一 138712, Homo sapiens peroxisome prolnerative activated receptor, gamma (PPARG) .
(標的配列)
NM_138712-953, ggagtccacgagatcattt (配列番号 872)
丽— 138712- 304, ctccctcatggcaattgaa (配列番号 873) 丽ー 138712-954, gagtccacgagatcattta (酉 3歹 lj番号 874)
厘— 138712- 445, ctgtcggatccacaaaaaa (配歹 [J番号 875)
NM_138712-409, cagattgaagcttatctat (配列番号 86)
(マウスのホモ口グに対しても有効な標的配列)
匪— 138712- 239, gcatctccaccttattatt (配歹 U番号 877)
丽—138712- 688, ggcgagggcgatcttgaca (配列番号 878)
匪一 138712- 664, gtccttcccgctgaccaaa (配列番号 879)
(腿 i対象遺伝子)
麗— 004421, Homo sapiens dishevelled, dsh homolog 1 (Drosophila) (DVL1) . (標的配列)
匿—004421-1173, ccgtcgtccgggtcatgca (酉 3歹番号 880)
(腿 i対象遺伝子)
丽— 004422, Homo sapiens dishevelled, dsh homolog 2 (Drosophila) (DVL2) . (標的配列)
雇— 004422-1253, gtccatacggacatggcat (酉 3列番号 881)
(R Ai対象遺伝子)
匿— 004423, Homo sapiens dishevelled, dsh homolog 3 (Drosophila; (DVL3) . (標的配列)
NM_004423-1197, gcctagacgacttccactt (配歹 lj番号 882)
(RNAi対象遺伝子)
NC— 001802, Human immunodeficiency virus 1, complete genome.
(標的配列)
NC一 001802- 8242, ggacagatagggttataga (酉 3歹 U番号 883)
NC_001802-340, gcgagagcgtcagtattaa (配歹 [J番号 884)
NC_001802-1222, gtagaccggttctataaaa (酉 S列番号 885)
NC_001802- 1818, cgacccctcgtcacaataa (酉 3歹番号 886)
NC_001802-4973, gccctaggtgtgaatatca (酉 3列番号 887)
NC一 001802- 5224, gcttagggcaacatatcta (配列番号 888) NC_001802-550, gaagaacttagatcattat (配列番号 889)
NC— 001802- 1777, gaactgtatcctttaactt (配列番号 890)
NC_001802-3244, gaaagactcctaaatttaa . (配列番号 891)
NC_001802-5225, cttagggcaacatatctat (配列番号 892)
[発明の効果]
本発明よれば、 実際に RNA i効果を示す s i RN Aを高い確率で得ることが できる。 したがって、 新規な s i RNAを調製する場合に、 試験者の経験等に基 づき実際に s i RNAを合成して RNA i効果を有する;^否力確認するため試行 錯誤を繰り返す労力を大幅に軽減できる。 すなわち、 本発明は、 新規な配列を有 する s i RNAの検索あるいは作製に極めて好適である。 さらに、 本発明により 、 所望の s i RN Aを短時間で多種得ることができる。 試行錯誤的に s i RNA を実際に作製する必要性が低減されるため、 RNA干渉を利用する試験、 製造な どの方法に要するコストを大幅に削減するこどができる。 また、 本発明は、 R N A i効果を利用したあらゆる試験、 製造などの方法を大幅に簡略化させると共に 、 方法としての確実性は大幅に向上させることができる。 本発明は、 哺乳類など の高等動物を対象とする R N A干渉を行う際に特に有効性を発揮するものである
産業上の利用可能性
以上のように、 本発明は、 RNA干 (RNA i n t e r f e r e n c e) に関し、 詳しくは、 RNA干渉を利用した試験、 製造などの効率を向上させる、 R N A干渉を生じさせるポリヌクレオチドの配列設計方法等に関する。

Claims

1. RNA干渉の標的遺伝子の塩基配列から、 下記 (a) から (d) の規則に 従う配列部位を検索する、 R N A干渉の標的塩基配列の検索方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3, 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから
一一-一 d
なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。
の + 1
1 5
2. 前記規則 ( c ) におレ、て、 7塩基のうち少なくとも 3塩基以上がアデ二ン 囲
、 チミンおよびゥラシルからなる群より選ばれる 1種または 2種以上である、 請 求の範囲第 1項に記載の標的塩基配列の検索方法。
3. 前記規則 (d) において、 塩基数が 13〜28である、 請求の範囲第 1項 または第 2項に記載の標的塩基配列の検索方法。
4. 下記 (a) から (d) の規則に従う塩基配列を標的遺伝子の塩基配列から 検索し、 検索された塩基配列と相同な塩基配列を設計する、 RNA干渉を生じさ せるポリヌクレオチドの塩基配列設計方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5' 末端の塩基が、 グァニンまたはシトシンである。
(c) 3' 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。
5. 前記規則 (c) において、 7塩基のうち少なくとも 3塩基以上がアデニン 、 チミンおょぴゥラシルからなる群より選ばれる 1種または 2種以上である、 請 求の範囲第 4項に記載の塩基配列設計方法。
6. 設計される相同な塩基配列の塩基数が 13〜 28である、 請求の範囲第 4 項または第 5項に記載の塩基配列設計方法。
7. 前記設計される相同な塩基配列の少なくとも 80%以上の塩基が検索され た塩基配列と一致するように設計する、 請求の範囲第 4項から第 6項のいずれか 一項に記載の塩基配列設計方法。
8. 検索された塩基配列の 3, 末端の塩基と設計される塩基配列の 3, 末端の 塩基とが同一であり、 かつ、 検索された塩基配列の 5, 末端の塩基と設計される 塩基配列の 5, 末端の塩基とが同一である、 請求の範囲第 4項から第 7項のいず れか一項に記載の塩基配列設計方法。
9. ポリヌクレオチドの 3, 末端に、 オーバーハング部位を付加する、 請求の 範囲第 4項から第 8項のいずれか一項に記載の塩基配列設計方法。
10. 2本鎖ポリヌクレオチドの作製方法であって、
一方の鎖が、 標的遺伝子の塩基配列中に含まれる、 下記 (a) か (d) の規則 に従う規定配列と相同な塩基配列の 3, 末端にオーバーハング部を設けて形成さ れ、
他方の鎖が、 前記規定配列と相同な塩基配列と相補的な配列の 3' 末端にオーバ ーハング部を設けて形成され、
各鎖の塩基数が 15〜 30であるように設計された 2本鎖ポリヌクレオチドを合 成する、 2本鎖ポリヌクレオチドの作製方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3 ' 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RN A干渉を生じさせ得る数である。
11. RN A干渉の標的遺伝子の塩基 列中から下記 (a) から ( d ) の規則 に従う塩基数 13〜 28の配列部位を検索し、 一方の鎖が、 標的遺伝子の塩基配 列中に含まれる、 下記 (a) 力 ら (d) の規則に従う規定配列と相同な塩基配列 の 3, 末端にオーバーハング部を設けて形成され、 他方の鎖が、 前記規定配列と 相同な塩基配列と相補的な配列の 3, 末端にオーバーハング部を設けて形成され 、 各鎖の塩基数が 15〜 30であるように合成された、 2本鎖ポリヌクレオチド 。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはゥラシルである。
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。
(c) 3, 末端の 7塩基の配列において、 アデニン、 チミンおよびゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
(d) 塩基数が、 細胞毒性を生じさせずに RNA干渉を生じさせ得る数である。
12. RNA干渉の標的遺伝子の塩基配列中から下記 (a) 力ら (d) の規則 に従う塩基数 13〜 28の配列部位を検索する工程と、
一方の鎖が、 標的遺伝子の塩基配列中に含まれる、 下記 (a) から (d) の規則 に従う規定配列と相同な塩基配列の 3, 末端にオーバーハング部を設けて形成さ れ、 他方の鎖が、 前記規定配列と相同な塩基配列と相補的な配列の 3, 末端にォ 一バーハング部を設けて形成され、 各鎖の塩基数が 15〜 30であるように設計 された 2本鎖ポリヌクレオチドを合成する工程と、
合成された 2本鎖ポリヌクレオチドを、 発現を抑制しようとする標的遺伝子の発 現系に導入して標的遺伝子の発現を抑制する工程と、
を含む、 遺伝子発現抑制方法。
(a) 3, 末端の塩基が、 アデニン、 チミンまたはウラシ^^である。 '
(b) 5, 末端の塩基が、 グァニンまたはシトシンである。 ( c ) 3 ' 末端の 7塩基の配列において、 アデニン、 チミンおょぴゥラシルから なる群より選ばれる 1種または 2種以上の塩基がリツチである。
( d ) 塩基数が、 細胞毒性を生じさせずに R NA干渉を生じさせ得る数である。
1 3 . R NA干渉の標的遺伝子の塩基配列情報を取得して、 上記塩基配列情報 の予め定めた塩基数の配列部位である部分塩基配列情報を作成する部分塩基配列 作成手段と、
上記部分塩基配列作成手段にて作成された上記部分塩基配列情報の 3, 末端の 塩基がアデニン、 チミン、 または、 ゥラシルである力否かを判定する 3, 末端塩 基判定手段と、
上記部分塩基配列作成手段にて作成された上記部分塩基配列情報の 5, 末端の 上記塩基がグァニン、 または、 シトシンである力、否かを判定する 5, 末端塩基判 定手段と、
上記部分塩基配列作成手段にて作成された上記部分塩基配列情報の上記 3, 末 端の 7塩基からなる上記塩基配列情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種または 2種以上の上記塩基がリツチな 上記塩基配列情報であるか否かを判定する特定塩基含有判定手段と、
上記 3 , 末端塩基判定手段、 上記 5, 末端塩基判定手段、 および、 上記特定塩 基含有判定手段にて判定された結果に基づいて、 上記部分塩基配列作成手段にて 作成された上記部分塩基配列情報から上記標的遺伝子に特異的に上記 R N A干渉 を生じさせる規定配列情報を選択する規定配列選択手段と、
を備えたことを特徴とする塩基配列処理装置。
1 4. 上記部分塩基配列作成手段は、
上記塩基配列情報の上記標的遺伝子のコード領域、 または、 転写領域に対応す る部位から、 上記予め定めた上記塩基数の上記部分塩基配列情報を作成する領域 指定塩基配列作成手段、
をさらに備えたことを特徴とする請求の範囲第 1 31頁に記載の塩基配列処理装 置。
1 5 . 上記部分塩基配列作成手段は、
異なる生物に由来する複数の上記塩基配列情報の間で共通する、 上記予め定め た上記塩基数の上記部分塩基配列情報を作成する共通塩基配列作成手段、 をさらに備えたことを特徴とする請求の範囲第 1 3項または第 1 4項に記載の 塩基配列処理装置。
1 6 . 上記リツチな上記塩基配列情報は、
上記 7塩基からなる上記塩基配列情報が、 上記アデニン、 上記チミン、 および 、 上記ゥラシルからなる群より選ばれる 1種または 2種以上の上記塩基が少なく とも 3塩基以上含まれる上記塩基配列情報であること、
を特徴とする請求の範囲第 1 3項力 ら第 1 5項のレ、ずれか一つに記載の塩基配 列処理装置。
1 7 . 上記予め定めた上記塩基数は、 1 3〜 2 8であること、
を特徴とする請求の範囲第 1 3項から第 1 6項のいずれか一つに記載の塩基配 列処理装置。
1 8 . 上記部分塩基配列作成手段は、
オーバーハング部位を含む上記部分塩基配列情報を作成するオーバーハング部 位含有塩基配列作成手段、
をさらに備えたことを特徴とする請求の範囲第 1 3項から第 1 7項のいずれか 一つに記載の塩基配列処理装置。
1 9 . 上記規定配列情報の少なくとも一方の末端に上記オーバーハング部位を 付加するオーバーハング部位付加手段、
を備えたことを特徴とする請求の範囲第 1 3項から第 1 7項のいずれか一つに 2004/048566
120 記載の塩基配列処理装置。
2 0. 上記オーバーハング部位の塩基数は、 2であること、
を特徴とする請求の範囲第 1 8項または第 1 9項に記載の塩基配列処理装置。
2 1 . 上記規定配列情報と同一または類似の上記塩基配列情報を他の上記塩基 配列情報から検索する同一類似塩基配列検索手段と、
上記同一類似塩基配列検索手段にて検索された上記同一または上記類似の上記 塩基配列情報に基づいて、 上記規定配列情報が上記標的遺伝子とは無関係の遺伝 子を標的にするか否かを評価する無関係遺伝子標的評価手段と、
を備えたことを特徴とする請求の範囲第 1 3項から第 2 0項のいずれか一つに 記載の塩基配列処理装置。
2 2. 上記無関係遺伝子標的評価手段は、
上記同一類似塩基配列検索手段にて検索された上記同一または上記類似の上記 塩基配列情報のうち上記標的遺伝子とは無関係の上記遺伝子の上記塩基配列情報 の総数、 および、 上記標的遺伝子とは無関係の上記遺伝子の上記塩基配列情報に 付された同一類似の度合いを示す値に基づレ、て、 上記同一類似の度合いを示す値 の逆数の総和を算出する総和算出手段と、
上記総和算出手段にて算出された上記総和に基づいて、 上記規定配列情報が上 記標的遺伝子とは無関係の上記遺伝子を標的にする力否かを評価する総和基準標 的評価手段と、
をさらに備えたことを特徴とする請求の範囲第 2 1項に記載の塩基配列処理装 置。
2 3 . R N A干渉の標的遺伝子の塩基配列情報を取得して、 上記塩基配列情報 の予め定めた塩基数の配列部位である部分塩基配列情報を作成する部分塩基配列 作成工程と、 上記部分塩基配列作成工程にて作成された上記部分塩基配列情報の 3, 末端の 塩基がアデニン、 チミン、 または、 ゥラシルである力否かを判定する 3, 末端塩 基判定工程と、
上記部分塩基配列作成工程にて作成された上記部分塩基配列情報の 5, 末端の 上記塩基がグァニン、 または、 シトシンである力否かを判定する 5, 末端塩基判 ' 定工程と、
上記部分塩基配列作成工程にて作成された上記部分塩基配列情報の上記 3 ' 末 端の 7塩基からなる上記塩基配列情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種または 2種以上の上記塩基がリッチな 上記塩基配列情報である力、否かを判定する特定塩基食有判定工程と、
上記 3 ' 末端塩基判定工程、 上記 5, 末端塩基判定工程、 および、 上記特定塩 基含有判定工程にて判定された結果に基づいて、 上記部分塩基配列作成工程にて 作成された上記部分塩基配列情報から上記標的遺伝子に特異的に上記 R N A干渉 を生じさせる規定配列情報を選択する規定配列選択工程と、
を含む塩基配列処理方法をコンピュータに実行させることを特徴とするプロ'グ ラム。
2 4 . 上記請求の範囲第 2 3項に記載されたプログラムを記録したことを特徴 とするコンピュータ読み取り可能な記録媒体。
2 5 . R N A干渉の標的遺伝子の塩基配列情報を処理する塩基配列処理装置と 、 クライアント装置とをネットワークを介して通信可能に接続された塩基配列処 理システムにおいて、
上記クライアント装置は、
上記標的遺伝子の名称または上記塩基配列情報を上記塩基配列処理装置に送信 する塩基配列送信手段と、
上記塩基配列処理装置より送信された、 上記標的遺伝子に特異的に上記 R N A 干渉を生じさせる規定配列情報を取得する規定配列取得手段と、 を備え、
上記塩基配列処理装置は、
上記クライアント装置より送信された上記標的遺伝子の名称に対応する塩基配 列情報または上記クライアント装置より送信された上記塩基配列情報を取得して 、 上記塩基配列情報の予め定めた塩基数の配列部位である部分塩基配列情報を作 成する部分塩基配列作成手段と、 .
上記部分塩基配列作成手段にて作成された上記部分塩基配列情報の 3, 末端の 塩基がアデニン、 チミン、 または、 ゥラシルである力否かを判定する 3, 末端塩 基判定手段と、
上記部分塩基配列作成手段にて作成された上記部分塩基配列情報の 5 , 末端の 上記塩基がグァニン、 または、 シトシンである力否かを判定する 5 ' 末端塩基判 定手段と、
上記部分塩基配列作成手段にて作成された上記部分塩基配列情報の上記 3, 末 端の 7塩基からなる上記塩基配列情報が、 上記アデニン、 上記チミン、 および、 上記ゥラシルからなる群より選ばれる 1種または 2種以上の上記塩基がリツチな 上記塩基配列情報であるカゝ否かを判定する特定塩基含有判定手段と、
上記 3, 末端塩基判定手段、 上記 5, 末端塩基判定手段、 および、 上記特定塩 基含有判定手段にて判定された結果に基づいて、 上記部分塩基配列作成手段にて 作成された上記部分塩基配列情報から上記規定配列情報を選択する規定配列選択 手段と、
上記規定配列選択手段にて選択された上記規定配列情報を上記クライアント装 置に送信する規定配列送信手段と、
を備えたことを特徴とする塩基配列処理システム。
PCT/JP2003/014893 2002-11-22 2003-11-21 Rna干渉の標的塩基配列検索方法、rna干渉を生じさせるポリヌクレオチドの塩基配列設計方法、2本鎖ポリヌクレオチドの作製方法、遺伝子の発現抑制方法、塩基配列処理装置、塩基配列処理方法をコンピュータに実行させるプログラム、記録媒体、および、塩基配列処理システム Ceased WO2004048566A1 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
EP03774133A EP1571209B1 (en) 2002-11-22 2003-11-21 Method of detecting target base sequence of rna interference, method of designing polynucleotide base sequence causing rna interference, method of constructing double-stranded polynucleotide, method of regulating gene expression, base sequence processing apparatus, program for running base sequence
US10/535,851 US20060275762A1 (en) 2002-11-22 2003-11-21 Method of detecting target base sequence of rna interference, method of designing polynucleotide base sequence causing rna interference, method of constructing double-stranded polynucleotide, method of regulating gene expression, base sequence processing apparatus, program for running base sequence processing method on comp
CA002511481A CA2511481A1 (en) 2002-11-22 2003-11-21 Method of designing polynucleotides for rna interference
JP2004555000A JP3839453B2 (ja) 2002-11-22 2003-11-21 Rna干渉の標的塩基配列検索方法、rna干渉を生じさせるポリヌクレオチドの塩基配列設計方法、2本鎖ポリヌクレオチドの作製方法、遺伝子の発現抑制方法、塩基配列処理装置、塩基配列処理方法をコンピュータに実行させるプログラム、記録媒体、および、塩基配列処理システム
CN2003801091084A CN1742086B (zh) 2002-11-22 2003-11-21 Rna干扰的目标碱基序列的搜索方法
AU2003284624A AU2003284624B2 (en) 2002-11-22 2003-11-21 Method for searching target base sequence of RNA interference, method for designing base sequence of polynucleotide for causing RNA interference, method for producing double-stranded polynucleotide, method for inhibiting gene expression, base sequence processing apparatus, program for running base sequence processing method on computer, recording medium, and base sequence processing system
AU2010201099A AU2010201099A1 (en) 2002-11-22 2010-03-19 Method of detecting target base sequence of RNA interference, method of designing polynucleotide base sequence causing RNA interference, method of constructing double-stranded polynucleotide, method of regulating gene expression, base sequence processing apparatus, program for running base sequence processing method on computer, recording medium, and base sequence processing system
US12/908,393 US20110033860A1 (en) 2002-11-22 2010-10-20 Method For Searching Target Base Sequence Of Rna Interference, Method For Designing Base Sequence Of Polynucleotide For Causing Rna Interference, Method For Producing Double-Stranded Polynucleotide, Method For Inhibiting Gene Expression, Base Sequence Processing Apparatus, Program For Running Base Sequence Processing Method On Computer, Recording Medium, And Base Sequence Processing System

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002340053 2002-11-22
JP2002-340053 2002-11-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/908,393 Continuation US20110033860A1 (en) 2002-11-22 2010-10-20 Method For Searching Target Base Sequence Of Rna Interference, Method For Designing Base Sequence Of Polynucleotide For Causing Rna Interference, Method For Producing Double-Stranded Polynucleotide, Method For Inhibiting Gene Expression, Base Sequence Processing Apparatus, Program For Running Base Sequence Processing Method On Computer, Recording Medium, And Base Sequence Processing System

Publications (1)

Publication Number Publication Date
WO2004048566A1 true WO2004048566A1 (ja) 2004-06-10

Family

ID=32375803

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/014893 Ceased WO2004048566A1 (ja) 2002-11-22 2003-11-21 Rna干渉の標的塩基配列検索方法、rna干渉を生じさせるポリヌクレオチドの塩基配列設計方法、2本鎖ポリヌクレオチドの作製方法、遺伝子の発現抑制方法、塩基配列処理装置、塩基配列処理方法をコンピュータに実行させるプログラム、記録媒体、および、塩基配列処理システム

Country Status (7)

Country Link
US (2) US20060275762A1 (ja)
EP (2) EP1571209B1 (ja)
JP (1) JP3839453B2 (ja)
CN (2) CN101914532A (ja)
AU (2) AU2003284624B2 (ja)
CA (1) CA2511481A1 (ja)
WO (1) WO2004048566A1 (ja)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1559785A1 (en) * 2004-01-28 2005-08-03 Bio-Think Tank Co., Ltd. Oligo- or polynucleotides for achieving RNA interference in mammalian cells
WO2005116204A1 (ja) * 2004-05-11 2005-12-08 Rnai Co., Ltd. Rna干渉を生じさせるポリヌクレオチド、および、これを用いた遺伝子発現抑制方法
JP2006031308A (ja) * 2004-07-15 2006-02-02 Mitsubishi Space Software Kk 核酸配列設計装置、核酸配列設計方法、核酸配列設計プログラム、機能阻害効果算出装置、機能阻害効果算出方法、機能阻害効果算出プログラム、機能阻害影響度算出装置、機能阻害影響度算出方法および機能阻害影響度算出プログラム。
JP2006238724A (ja) * 2005-02-28 2006-09-14 National Institute Of Infectious Diseases Rna干渉ポリヌクレオチド混合物の設計方法、rna干渉ポリヌクレオチド混合物の設計装置、rna干渉ポリヌクレオチド混合物の作製方法、rna干渉ポリヌクレオチド混合物の設計プログラム、及びrna干渉ポリヌクレオチド混合物
WO2006112239A1 (ja) * 2005-04-15 2006-10-26 National University Corporation Tottori University hTERT発現調節遺伝子
WO2008112218A2 (en) 2007-03-12 2008-09-18 Antigen Express, Inc. Li-rnai involved li suppression in cancer immunotherapy
US7517864B2 (en) 2001-05-18 2009-04-14 Sirna Therapeutics, Inc. RNA interference mediated inhibition of vascular endothelial growth factor and vascular endothelial growth factor receptor gene expression using short interfering nucleic acid (siNA)
WO2010101249A1 (ja) 2009-03-06 2010-09-10 国立大学法人三重大学 T細胞の機能増強方法
US7858625B2 (en) 2001-05-18 2010-12-28 Sirna Therapeutics, Inc. Conjugates and compositions for cellular delivery
US7858769B2 (en) 2004-02-10 2010-12-28 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using multifunctional short interfering nucleic acid (multifunctional siNA)
US7923547B2 (en) 2002-09-05 2011-04-12 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US7989612B2 (en) 2002-02-20 2011-08-02 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
CN101724027B (zh) * 2009-11-24 2012-04-25 哈尔滨医科大学 蛋白质三聚体化模序及其应用
JP2012223202A (ja) * 2004-12-22 2012-11-15 Alnylam Pharmaceuticals Inc 遺伝子サイレンシングに有用なhbvおよびhcv保存配列
US9181551B2 (en) 2002-02-20 2015-11-10 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US9260471B2 (en) 2010-10-29 2016-02-16 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using short interfering nucleic acids (siNA)
WO2016196388A1 (en) 2015-05-29 2016-12-08 Juno Therapeutics, Inc. Composition and methods for regulating inhibitory interactions in genetically engineered cells
US9657294B2 (en) 2002-02-20 2017-05-23 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
WO2018071873A2 (en) 2016-10-13 2018-04-19 Juno Therapeutics, Inc. Immunotherapy methods and compositions involving tryptophan metabolic pathway modulators
US9994853B2 (en) 2001-05-18 2018-06-12 Sirna Therapeutics, Inc. Chemically modified multifunctional short interfering nucleic acid molecules that mediate RNA interference
WO2018106732A1 (en) 2016-12-05 2018-06-14 Juno Therapeutics, Inc. Production of engineered cells for adoptive cell therapy
US10508277B2 (en) 2004-05-24 2019-12-17 Sirna Therapeutics, Inc. Chemically modified multifunctional short interfering nucleic acid molecules that mediate RNA interference
US10513703B2 (en) 2014-11-10 2019-12-24 Alnylam Pharmaceuticals, Inc. Hepatitis B virus (HBV) iRNA compositions and methods of use thereof
US11324820B2 (en) 2017-04-18 2022-05-10 Alnylam Pharmaceuticals, Inc. Methods for the treatment of subjects having a hepatitis b virus (HBV) infection
JP2023537610A (ja) * 2020-08-12 2023-09-04 スペラタム バイオファーマ インコーポレイテッド ゲノム及びサブゲノムウイルスRNAのRNAiを介した調節のための基質配列

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050176025A1 (en) * 2001-05-18 2005-08-11 Sirna Therapeutics, Inc. RNA interference mediated inhibition of B-cell CLL/Lymphoma-2 (BCL-2) gene expression using short interfering nucleic acid (siNA)
US20050159381A1 (en) * 2001-05-18 2005-07-21 Sirna Therapeutics, Inc. RNA interference mediated inhibition of chromosome translocation gene expression using short interfering nucleic acid (siNA)
US20050158735A1 (en) * 2001-05-18 2005-07-21 Sirna Therapeutics, Inc. RNA interference mediated inhibition of proliferating cell nuclear antigen (PCNA) gene expression using short interfering nucleic acid (siNA)
US20040019001A1 (en) * 2002-02-20 2004-01-29 Mcswiggen James A. RNA interference mediated inhibition of protein typrosine phosphatase-1B (PTP-1B) gene expression using short interfering RNA
US20050196765A1 (en) * 2001-05-18 2005-09-08 Sirna Therapeutics, Inc. RNA interference mediated inhibition of checkpoint Kinase-1 (CHK-1) gene expression using short interfering nucleic acid (siNA)
EP1640452A4 (en) * 2003-05-30 2009-12-23 Nippon Shinyaku Co Ltd OLIGOBICATENARY RNA INHIBITING BCL-2 EXPRESSION AND MEDICINAL COMPOSITION CONTAINING THE SAME
TW201336514A (zh) * 2006-04-13 2013-09-16 Alcon Res Ltd RNA干擾(RNAi)所媒介之與脾酪胺酸激酶相關之發炎症狀的抑制作用(二)
US20100280097A1 (en) * 2007-09-18 2010-11-04 Intradigm Corporation Compositions comprising hif-1 alpha sirna and methods of use thereof
WO2009108217A2 (en) * 2007-09-18 2009-09-03 Intradigm Corporation Compositions comprising k-ras sirna and methods of use
EP2250265A1 (en) * 2008-03-12 2010-11-17 Intradigm Corporation Compositions comprising notch1 sirna and methods of use thereof
US9849146B2 (en) 2009-07-20 2017-12-26 Rutgers, The State University Of New Jersey Inhibition of nonsense mediated mRNA decay by drugs that prevent hypusination of eukaryotic initiation factor 5A
US8603814B2 (en) 2009-07-20 2013-12-10 Rutgers The State University Of New Jersey Method of inhibiting nonsense-mediated mRNA decay
WO2012005898A2 (en) * 2010-06-15 2012-01-12 Alnylam Pharmaceuticals, Inc. Chinese hamster ovary (cho) cell transcriptome, corresponding sirnas and uses thereof
WO2012138223A2 (en) * 2011-04-05 2012-10-11 Academisch Ziekenhuis Leiden H.O.D.N. Lumc Compounds and methods for altering activin receptor-like kinase signalling
US20130176342A1 (en) * 2012-01-11 2013-07-11 Liqun Zhu System and method for imaging dna sequences for gene-targeting process
CN102643815A (zh) * 2012-03-12 2012-08-22 中国水产科学研究院东海水产研究所 一种抗RNA病毒siRNA分子的设计方法
CN102703508A (zh) * 2012-05-18 2012-10-03 边红 靶向GSK3β基因RNA干扰重组慢病毒载体及其构建、筛选方法
CN104342440A (zh) * 2013-07-30 2015-02-11 上海交通大学医学院附属新华医院 CDKL1基因及其siRNA和应用
CN105779452A (zh) * 2016-03-10 2016-07-20 上海吉玛制药技术有限公司 一种抑制肿瘤生长的寡聚核酸及其应用
BR112021001613A2 (pt) 2018-08-13 2021-05-04 Alnylam Pharmaceuticals, Inc. agentes de ácido ribonucleico de fita dupla, célula, composições farmacêuticas, métodos de inibição da expressão gênica, de inibição da replicação e de tratar um sujeito, métodos para reduzir o nível de um antígeno e para reduzir a carga viral e uso de um agente de dsrna
EP4127169A1 (en) * 2020-03-27 2023-02-08 University of Rochester Targeted destruction of viral rna by crispr-cas13
CN111518809A (zh) * 2020-05-12 2020-08-11 杭州勇诚睿生物科技有限公司 干扰新冠病毒COVID-19基因表达的siRNA及其应用
CN112574990A (zh) * 2020-12-11 2021-03-30 武汉大学 沉默人DAPK1基因表达的shRNA分子及其应用
CN114561389A (zh) * 2022-03-15 2022-05-31 南通市肿瘤医院 Vrk1表达抑制剂及其应用
CN115801030B (zh) * 2022-10-13 2023-09-26 成都老鹰信息技术有限公司 一种载波自动搜索系统及其搜索方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE160534T1 (de) * 1984-04-27 1986-02-27 Hitachi Software Engineering Co., Ltd., Yokohama, Kanagawa Eingabegeraet zur eingabe der genetischen grundfolgeinformation.
US6434488B1 (en) * 1999-12-03 2002-08-13 International Business Machines Corporation Alignment free methodology for rapid determination of differences between a test data set and known data sets
JP3431135B2 (ja) * 2000-07-14 2003-07-28 独立行政法人農業技術研究機構 遺伝子の類縁性検索方法および遺伝子の類縁性検索システム
KR100909681B1 (ko) * 2000-12-01 2009-07-29 막스-플랑크-게젤샤프트 츄어 푀르더룽 데어 비쎈샤프텐 에.파우. Rna 간섭을 매개하는 작은 rna 분자
EP2213738B1 (en) * 2002-11-14 2012-10-10 Dharmacon, Inc. siRNA molecules targeting Bcl-2

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CAPLEN N J, ET AL: "SPECIFIC INHIBITION OF GENE EXPRESSION BY SMALL DOUBLE-STRANDED RNAS IN INVERTEBRATE AND VERTEBRATE SYSTEMS", PROC NATL ACAD SCI USA, vol. 98, no. 17, 2001, pages 9742 - 9747, XP002232936 *
ELBASHIR ET AL., EMBO JOURNAL, vol. 20, no. 23, December 2001 (2001-12-01)
OSHIUMI H, ET AL: "RNA INTERFERENCE FOR MAMMALIAN CELLS", NIPPON YAKURIGAKU ZASSHI, vol. 120, no. 20, August 2002 (2002-08-01), pages 91 - 95, XP002974681 *
PAUL C P, ET AL: "EFFECTIVE EXPRESSION OF SMALL INTERFERING RNA IN HUMAN CELLS", NAT BIOTECHNOL, vol. 20, no. 5, May 2002 (2002-05-01), pages 505 - 508, XP001121066 *
See also references of EP1571209A4

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7517864B2 (en) 2001-05-18 2009-04-14 Sirna Therapeutics, Inc. RNA interference mediated inhibition of vascular endothelial growth factor and vascular endothelial growth factor receptor gene expression using short interfering nucleic acid (siNA)
US9994853B2 (en) 2001-05-18 2018-06-12 Sirna Therapeutics, Inc. Chemically modified multifunctional short interfering nucleic acid molecules that mediate RNA interference
US7858625B2 (en) 2001-05-18 2010-12-28 Sirna Therapeutics, Inc. Conjugates and compositions for cellular delivery
US10351852B2 (en) 2002-02-20 2019-07-16 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US10662428B2 (en) 2002-02-20 2020-05-26 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US8202979B2 (en) 2002-02-20 2012-06-19 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid
US9732344B2 (en) 2002-02-20 2017-08-15 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US10889815B2 (en) 2002-02-20 2021-01-12 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US9957517B2 (en) 2002-02-20 2018-05-01 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US10000754B2 (en) 2002-02-20 2018-06-19 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US9657294B2 (en) 2002-02-20 2017-05-23 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US9738899B2 (en) 2002-02-20 2017-08-22 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US9181551B2 (en) 2002-02-20 2015-11-10 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US9771588B2 (en) 2002-02-20 2017-09-26 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US8846894B2 (en) 2002-02-20 2014-09-30 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US7989612B2 (en) 2002-02-20 2011-08-02 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US7923547B2 (en) 2002-09-05 2011-04-12 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
US7956176B2 (en) 2002-09-05 2011-06-07 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using chemically modified short interfering nucleic acid (siNA)
EP1559785A1 (en) * 2004-01-28 2005-08-03 Bio-Think Tank Co., Ltd. Oligo- or polynucleotides for achieving RNA interference in mammalian cells
US7858769B2 (en) 2004-02-10 2010-12-28 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using multifunctional short interfering nucleic acid (multifunctional siNA)
JPWO2005116204A1 (ja) * 2004-05-11 2008-06-19 株式会社アルファジェン Rna干渉を生じさせるポリヌクレオチド、および、これを用いた遺伝子発現抑制方法
WO2005116204A1 (ja) * 2004-05-11 2005-12-08 Rnai Co., Ltd. Rna干渉を生じさせるポリヌクレオチド、および、これを用いた遺伝子発現抑制方法
US10508277B2 (en) 2004-05-24 2019-12-17 Sirna Therapeutics, Inc. Chemically modified multifunctional short interfering nucleic acid molecules that mediate RNA interference
JP2006031308A (ja) * 2004-07-15 2006-02-02 Mitsubishi Space Software Kk 核酸配列設計装置、核酸配列設計方法、核酸配列設計プログラム、機能阻害効果算出装置、機能阻害効果算出方法、機能阻害効果算出プログラム、機能阻害影響度算出装置、機能阻害影響度算出方法および機能阻害影響度算出プログラム。
JP2015003913A (ja) * 2004-12-22 2015-01-08 アルナイラム ファーマシューティカルズ, インコーポレイテッドAlnylam Pharmaceuticals, Inc. 遺伝子サイレンシングに有用なhbvおよびhcv保存配列
JP2012223202A (ja) * 2004-12-22 2012-11-15 Alnylam Pharmaceuticals Inc 遺伝子サイレンシングに有用なhbvおよびhcv保存配列
JP2006238724A (ja) * 2005-02-28 2006-09-14 National Institute Of Infectious Diseases Rna干渉ポリヌクレオチド混合物の設計方法、rna干渉ポリヌクレオチド混合物の設計装置、rna干渉ポリヌクレオチド混合物の作製方法、rna干渉ポリヌクレオチド混合物の設計プログラム、及びrna干渉ポリヌクレオチド混合物
US8148514B2 (en) 2005-04-15 2012-04-03 National University Corporation Tottori University hTERT gene expression regulatory gene
US8124755B2 (en) 2005-04-15 2012-02-28 National University Corporation Tottori University hTERT gene expression regulatory gene
WO2006112239A1 (ja) * 2005-04-15 2006-10-26 National University Corporation Tottori University hTERT発現調節遺伝子
US8148513B2 (en) 2005-04-15 2012-04-03 National University Corporation Tottori University hTERT gene expression regulatory gene
EP2098593A1 (en) * 2005-04-15 2009-09-09 National University Corporation Tottori University hTERT expression regulatory gene
US7985852B2 (en) 2005-04-15 2011-07-26 National University Corporation Tottori University hTERT gene expression regulatory gene
WO2008112218A2 (en) 2007-03-12 2008-09-18 Antigen Express, Inc. Li-rnai involved li suppression in cancer immunotherapy
US9181525B2 (en) 2009-03-06 2015-11-10 Mie University Method for enhancing a function of a T cell
WO2010101249A1 (ja) 2009-03-06 2010-09-10 国立大学法人三重大学 T細胞の機能増強方法
US9603874B2 (en) 2009-03-06 2017-03-28 Takara Bio Inc. Method for enhancing a function of a T cell
CN101724027B (zh) * 2009-11-24 2012-04-25 哈尔滨医科大学 蛋白质三聚体化模序及其应用
US9260471B2 (en) 2010-10-29 2016-02-16 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using short interfering nucleic acids (siNA)
US9970005B2 (en) 2010-10-29 2018-05-15 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using short interfering nucleic acids (siNA)
US11193126B2 (en) 2010-10-29 2021-12-07 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using short interfering nucleic acids (siNA)
US11932854B2 (en) 2010-10-29 2024-03-19 Sirna Therapeutics, Inc. RNA interference mediated inhibition of gene expression using short interfering nucleic acids (siNA)
US10513703B2 (en) 2014-11-10 2019-12-24 Alnylam Pharmaceuticals, Inc. Hepatitis B virus (HBV) iRNA compositions and methods of use thereof
WO2016196388A1 (en) 2015-05-29 2016-12-08 Juno Therapeutics, Inc. Composition and methods for regulating inhibitory interactions in genetically engineered cells
WO2018071873A2 (en) 2016-10-13 2018-04-19 Juno Therapeutics, Inc. Immunotherapy methods and compositions involving tryptophan metabolic pathway modulators
EP4190335A1 (en) 2016-10-13 2023-06-07 Juno Therapeutics, Inc. Immunotherapy methods and compositions involving tryptophan metabolic pathway modulators
US11896615B2 (en) 2016-10-13 2024-02-13 Juno Therapeutics, Inc. Immunotherapy methods and compositions involving tryptophan metabolic pathway modulators
WO2018106732A1 (en) 2016-12-05 2018-06-14 Juno Therapeutics, Inc. Production of engineered cells for adoptive cell therapy
US11324820B2 (en) 2017-04-18 2022-05-10 Alnylam Pharmaceuticals, Inc. Methods for the treatment of subjects having a hepatitis b virus (HBV) infection
JP2023537610A (ja) * 2020-08-12 2023-09-04 スペラタム バイオファーマ インコーポレイテッド ゲノム及びサブゲノムウイルスRNAのRNAiを介した調節のための基質配列

Also Published As

Publication number Publication date
US20060275762A1 (en) 2006-12-07
EP1571209A4 (en) 2006-12-13
US20110033860A1 (en) 2011-02-10
CN1742086A (zh) 2006-03-01
AU2010201099A1 (en) 2010-04-15
AU2003284624B2 (en) 2010-06-03
CA2511481A1 (en) 2004-06-10
JPWO2004048566A1 (ja) 2006-03-23
EP2298886A3 (en) 2011-12-14
CN101914532A (zh) 2010-12-15
EP1571209A1 (en) 2005-09-07
AU2003284624A1 (en) 2004-06-18
EP1571209B1 (en) 2012-06-13
CN1742086B (zh) 2010-05-12
EP2298886A2 (en) 2011-03-23
JP3839453B2 (ja) 2006-11-01

Similar Documents

Publication Publication Date Title
WO2004048566A1 (ja) Rna干渉の標的塩基配列検索方法、rna干渉を生じさせるポリヌクレオチドの塩基配列設計方法、2本鎖ポリヌクレオチドの作製方法、遺伝子の発現抑制方法、塩基配列処理装置、塩基配列処理方法をコンピュータに実行させるプログラム、記録媒体、および、塩基配列処理システム
Becker et al. High-throughput analysis reveals rules for target RNA binding and cleavage by AGO2
Kawamura et al. Drosophila endogenous small RNAs bind to Argonaute 2 in somatic cells
Wang et al. ADAR regulates RNA editing, transcript stability, and gene expression
Hsieh et al. A library of siRNA duplexes targeting the phosphoinositide 3‐kinase pathway: determinants of gene silencing for use in cell‐based screens
Cuperus et al. Identification of MIR390a precursor processing-defective mutants in Arabidopsis by direct genome sequencing
Wang et al. The initial uridine of primary piRNAs does not create the tenth adenine that Is the hallmark of secondary piRNAs
Zanni et al. Distribution, evolution, and diversity of retrotransposons at the flamenco locus reflect the regulatory properties of piRNA clusters
Fellmann et al. Functional identification of optimized RNAi triggers using a massively parallel sensor assay
JPWO2005116204A1 (ja) Rna干渉を生じさせるポリヌクレオチド、および、これを用いた遺伝子発現抑制方法
Calin et al. MiR-15a and miR-16-1 cluster functions in human leukemia
Gradia et al. The role of mismatched nucleotides in activating the hMSH2-hMSH6 molecular switch
Burgler et al. Prediction and verification of microRNA targets by MovingTargets, a highly adaptable prediction method
Chen et al. A universal plasmid library encoding all permutations of small interfering RNA
Ameres et al. Target RNA-directed tailing and trimming purifies the sorting of endo-siRNAs between the two Drosophila Argonaute proteins
Sapiro et al. Cis regulatory effects on A-to-I RNA editing in related Drosophila species
Hu et al. Quality-control mechanism for telomerase RNA folding in the cell
Wu et al. Novel microRNA regulators of atrial natriuretic peptide production
Oulas et al. A new microRNA target prediction tool identifies a novel interaction of a putative miRNA with CCND2
Stoyko et al. Hierarchical length and sequence preferences establish a single major piRNA 3′-end
Konstantinidou et al. A comparative roadmap of PIWI-interacting RNAs across seven species reveals insights into de novo piRNA-precursor formation in mammals
Shang et al. Parameters of clustered suboptimal miRNA biogenesis
Shoji et al. A potential role of inefficient and non-specific piRNA production from the whole transcriptome
Zhang et al. Characteristics and expression of lncRNA and transposable elements in Drosophila aneuploidy
Zhang et al. Deep annotation of long noncoding RNAs by assembling RNA-seq and small RNA-seq data

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2004555000

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2003284624

Country of ref document: AU

Ref document number: 2003774133

Country of ref document: EP

Ref document number: 2511481

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 1378/CHENP/2005

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 20038A91084

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2003774133

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2006275762

Country of ref document: US

Ref document number: 10535851

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 10535851

Country of ref document: US