[go: up one dir, main page]

WO2013147208A1 - ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置 - Google Patents

ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置 Download PDF

Info

Publication number
WO2013147208A1
WO2013147208A1 PCT/JP2013/059645 JP2013059645W WO2013147208A1 WO 2013147208 A1 WO2013147208 A1 WO 2013147208A1 JP 2013059645 W JP2013059645 W JP 2013059645W WO 2013147208 A1 WO2013147208 A1 WO 2013147208A1
Authority
WO
WIPO (PCT)
Prior art keywords
base sequence
sequence information
nucleotide
polynucleotide
pulses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2013/059645
Other languages
English (en)
French (fr)
Inventor
川合 知二
敬人 大城
一喜 松原
匡幸 古橋
真楠 筒井
正輝 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Osaka NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Priority to KR1020137027253A priority Critical patent/KR20140138526A/ko
Priority to CA2833368A priority patent/CA2833368A1/en
Priority to CN201380001067.0A priority patent/CN103492865B/zh
Priority to JP2013541893A priority patent/JP6343148B2/ja
Priority to EP13767259.8A priority patent/EP2833126A4/en
Priority to US14/112,189 priority patent/US20140055150A1/en
Publication of WO2013147208A1 publication Critical patent/WO2013147208A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • a conventional sequencer of polynucleotides (specifically DNA) is based on a light measurement technique of identifying a fluorescent label, and does not directly identify the nucleotide itself forming the polynucleotide. Therefore, if the nucleotide sequence of a polynucleotide is to be analyzed by a conventional sequencer, it is necessary to perform PCR using the polynucleotide as a template and add a fluorescent label to the polynucleotide extended by the PCR. This operation not only requires a large number of reagents, but also requires a lot of time. Therefore, analysis of the nucleotide sequence of a polynucleotide by a conventional sequencer requires a great deal of money and time.
  • the technique for analyzing the nucleotide sequence of a polynucleotide based on the tunnel current described above is suitable for determining the nucleotide sequence of a nucleotide or a short polynucleotide, but the nucleotide sequence of a long polynucleotide can be determined using this technique. There has been no established method for determining and therefore it was necessary to establish that method as soon as possible.
  • the present invention has been made in view of the above problems, and an object thereof is to determine the base sequence of a long polynucleotide using a technique for analyzing the base sequence of a polynucleotide based on a tunnel current. Establishing a method and apparatus.
  • the method for determining the base sequence of the polynucleotide of the present invention is a method for determining the base sequence of a polynucleotide in order to solve the above-mentioned problem, and the first step of allowing the polynucleotide to pass between electrode pairs. And a second step of detecting a plurality of pulses of a tunnel current generated when the polynucleotide passes between the electrode pair, and measuring a maximum current value and a pulse duration for each of the plurality of pulses. Between the maximum current values of the plurality of pulses and the reference current value corresponding to the electronic state due to the energy level difference between the individual nucleotides and the metal forming the electrode pair.
  • a fourth step of extracting the base sequence a fifth step of searching for a base sequence common to at least two secondary base sequence information of the plurality of secondary base sequence information, and the common base sequence
  • an apparatus for determining the base sequence of a polynucleotide of the present invention comprises an electrode pair having a distance between electrodes through which a polynucleotide can pass, and the polynucleotide passes between the electrode pair. And detecting a plurality of pulses of the tunnel current occurring in each of the plurality of pulses, measuring a maximum current value and a pulse duration for each of the plurality of pulses, and a magnitude order between the maximum current values of the plurality of pulses. And the order of magnitude between the reference current values corresponding to the electronic states due to the energy level difference between the individual nucleotides and the metal forming the electrode pair.
  • a primary base sequence information creation unit that creates primary base sequence information in which each of the above is associated with a specific type of nucleotide, and the pulse from the plurality of pulses
  • a secondary base sequence information extraction unit that extracts a pulse group including pulses having a continuous duration and extracts a plurality of secondary base sequence information corresponding to the pulse group from the primary base sequence information
  • a common sequence search unit that searches for a common base sequence between at least two pieces of secondary base sequence information of the plurality of secondary base sequence information, and the common base sequence through the common base sequence.
  • a sequence information linking unit that links the secondary base sequence information having the same base sequence.
  • the present invention is capable of reading base sequence information directly from a polynucleotide such as DNA, as well as directly reading base sequence information from a polynucleotide such as RNA. Play.
  • a polynucleotide for example, DNA
  • a PCR reaction using the polynucleotide can be omitted.
  • the base sequence of the polynucleotide can be determined in a short time.
  • the present invention does not require a polynucleotide cleavage treatment as in the conventional shotgun sequencing method, it has the effect that the base sequence of the polynucleotide can be determined easily and in a short time.
  • the present invention has an effect that even if it is a modified polynucleotide or a damaged polynucleotide, its base sequence can be determined.
  • the present invention has an effect that gene expression information and epigenetic information related to aging or disease can be obtained directly from a polynucleotide.
  • the present invention produces an effect that even if it is a very small amount of polynucleotide (for example, one molecule of DNA or RNA), its base sequence can be determined.
  • polynucleotide for example, one molecule of DNA or RNA
  • the present invention has an effect that the base sequence of a polynucleotide can be determined stably.
  • the present invention provides a polynucleotide that is stable even under conditions where the biomolecule is denatured (for example, under high temperature conditions where DNA or RNA breaks hydrogen bonds formed between molecules).
  • the effect is that the base sequence can be determined.
  • the method for determining the base sequence of the polynucleotide of the present invention includes the following first to sixth steps. That means First step: a step of passing a polynucleotide between a pair of electrodes. Second step: a step of detecting a plurality of pulses of tunneling current generated when the polynucleotide passes between the electrode pair, and measuring a maximum current value and a pulse duration for each of the plurality of pulses.
  • the first step is a step of passing the polynucleotide between the electrode pair.
  • Deoxyadenosine monophosphate dAMP
  • deoxyadenosine diphosphate dADP
  • deoxyadenosine triphosphate dATP
  • deoxyguanosine monophosphate dGMP
  • deoxyguanosine diphosphate Acid dGDP
  • deoxyguanosine triphosphate dGTP
  • deoxycytidine monophosphate dCMP
  • deoxycytidine diphosphate deoxycytidine triphosphate
  • deoxyuridine monophosphate dUMP
  • Examples include deoxyuridine diphosphate (dUMP), deoxyuridine diphosphate (dUTP), deoxythymidine monophosphate (dTMP), deoxythymidine diphosphate (dTDP), and deoxythymidine triphosphate (dTTP).
  • the ribonucleotide or deoxyribonucleotide subjected to chemical modification is not particularly limited, but the base from methylcytosine, methyladenine, oxoguanine, hydroxymethylcytosine, thymine dimer, methyladenine, formylcytosine, and ribonucleotide or deoxyribonucleotide Desorbed and the like.
  • the specific method of passing the polynucleotide between the electrode pair is not particularly limited.
  • the polynucleotide is moved by thermal diffusion (in other words, Brownian motion) or AC voltage, and the movement of the electrode pair is caused by the movement. It is possible to pass between. In these, it is preferable to move a polynucleotide by thermal diffusion and to pass between electrode pairs by the movement.
  • thermal diffusion in other words, Brownian motion
  • AC voltage AC voltage
  • the distance between the electrode pair is important. If the distance between the electrode pair is too longer than the molecular diameter of each nucleotide constituting the polynucleotide, it will be difficult for a tunnel current to flow between the electrode pair, or two or more polynucleotides may be Get into. On the other hand, if the distance between the electrode pair is too shorter than the molecular diameter of each nucleotide constituting the polynucleotide, the polynucleotide cannot enter between the electrode pair.
  • the distance between the electrodes forming the electrode pair is preferably slightly shorter, equal to, or slightly longer than the molecular diameter of the nucleotide constituting the polynucleotide.
  • the distance between the electrodes is 0.5 to 2 times the nucleotide molecular diameter, preferably 1 to 1.5 times, and preferably 1 to 1.2 times. More preferably, it is a length.
  • the molecular diameter of nucleotides is known to those skilled in the art, the person skilled in the art in contact with the present specification can appropriately select the optimum distance between electrode pairs.
  • the distance between the electrode pair is, for example, 0.5 nm to 2 nm, preferably 1 nm to 1.5 nm, based on the molecular diameter.
  • it may be set to 1 nm to 1.2 nm.
  • the rate of change in the distance between the electrodes is preferably 1% or less, more preferably 0.1% or less, still more preferably 0.01% or less, and 0.001% or less. More preferred.
  • the electrode pair produced by the conventional technique seems to keep the distance between the electrodes constant, but the distance between the electrodes actually changes slightly. . Even if the distance is fine, if the distance between the electrodes changes, the value of the tunnel current changes. That is, the value of the tunnel current derived from the same substance is changed, and the determination accuracy of the polynucleotide base sequence is lowered.
  • the accuracy of determining the base sequence of the polynucleotide can be further increased.
  • an electrode pair can be produced by the following procedure.
  • the second nucleotide may be a nucleotide adjacent to the first nucleotide or may be a nucleotide not adjacent to the first nucleotide. Whether or not the second nucleotide is adjacent to the first nucleotide can be determined based on the pulse duration, which will be described later.
  • the third step compares the order of magnitude between the maximum current values of the plurality of pulses with the order of magnitude between the reference current values of individual nucleotides (referred to as reference nucleotides), thereby
  • This may be a step of creating primary base sequence information in which each of the pulses is associated with a specific type of nucleotide.
  • the reference current value When determining the reference current value, pass the reference nucleotide individually and multiple times between the electrode pairs, measure multiple tunnel currents for each reference nucleotide, and determine the maximum current value of the multiple tunnel current values. The maximum current value that appears most frequently may be used as the reference current value.
  • the tunnel current generated between the electrode pair can be measured using a known ammeter. Further, the tunnel current signal may be once amplified using, for example, a current amplifier. By using a current amplifier, a weak tunnel current value can be amplified, so that the tunnel current can be measured with high sensitivity. Examples of the current amplifier include a commercially available variable high-speed current amplifier (manufactured by Femto, catalog number: DHPCA-100).
  • the pulse due to the reference nucleotide detected in this way has peaks of various heights. These peaks appear due to changes in the distance between the electrode and the reference nucleotide based on the movement of the reference nucleotide between the electrode pair. That is, if the distance between the reference nucleotide and the electrode is shortened, a tunnel current is likely to be generated, so that the current value of the tunnel current increases. On the other hand, when the distance between the reference nucleotide and the electrode is increased, the tunnel current is less likely to be generated, so that the current value of the tunnel current is reduced.
  • the inventors set the mode values of reference nucleotides dGMP, dAMP, dCMP, dTMP, rGMP, rAMP, rCMP and rUMP to 87 pS, 67 pS, 60 pS, 39 pS, respectively. 123 pS, 92 pS, 64 pS and 50 pS were demonstrated.
  • the mode values of the base nucleotides from the reference nucleotides methylcytosine, oxoguanine, and ribonucleotide or deoxyribonucleotide were 105 pS, 98 pS, and 0 pS, respectively.
  • the maximum current value of each pulse measured in the second step is compared with the above-described reference current value. If the maximum current value is included in the range of 67 ⁇ 17 pS, the pulse is derived from dAMP. If the maximum current value is not included in the range of 67 ⁇ 17 pS, it can be determined that the pulse is not a pulse derived from dAMP.
  • the maximum current value of each pulse measured in the second step is compared with the reference current value described above. If the maximum current value is included in the range of 39 ⁇ 11 pS, the pulse is derived from dTMP. If the maximum current value is not included in the range of 39 ⁇ 11 pS, it can be determined that the pulse is not a pulse derived from dTMP.
  • the base sequence of a polynucleotide for example, DNA or RNA
  • N the number of pulses belonging to one pulse group
  • the number of pulses belonging to one pulse group is preferably N / 3 or more, more preferably N / 2, and even more preferably N, More preferably, the number is N or more.
  • the number of pulses belonging to one pulse group is preferably 50 or more, more preferably N / 2, still more preferably N, and N It is still more preferable that it is above.
  • the number of pulses belonging to one pulse group is preferably 3 or more, more preferably 4 or more, further preferably 5 or more, and 6 or more. More preferably, it is more preferably 7 or more. The larger the number of pulses belonging to one pulse group, the better.
  • pulse duration corresponding to one nucleotide can be determined by, for example, obtaining the pulse duration of the reference nucleotide at the same time when measuring the maximum frequency of the maximum current value of the reference nucleotide.
  • the longer the total time that the pulse duration continues the better.
  • the pulse duration is continuous for at least 2 ms, at least 5 ms, at least 10 ms or more. If it is the said structure, not only noise can be removed but the base sequence of polynucleotide can be determined longer.
  • the electrode pair when extracting a secondary base sequence based on a stochastic method, it is more preferable to use an electrode pair in which the distance between the electrodes is kept constant. That is, it is preferable that the electrode pair does not change the distance between the electrodes when the tunnel current is measured.
  • the accuracy of the secondary base sequence information extracted by the stochastic method can be improved. That is, a more accurate secondary base sequence can be extracted.
  • the base sequence of the polynucleotide can be more accurately determined based on the data relating to the tunnel current.
  • the secondary base sequence can be extracted with a stable accuracy of about 80% or more, and the polynucleotide base sequence can be accurately determined based on the highly accurate secondary base sequence. Can be determined.
  • the fifth step is a step of searching for a base sequence that is common between at least two pieces of secondary base sequence information of the plurality of secondary base sequence information. That is, the fifth step is a step of searching for a place where the secondary base sequence information is connected from the secondary base sequence information, which is information obtained by fragmenting the full-length base sequence information of the polynucleotide.
  • the common base sequences searched in the fifth step are common among as many secondary base sequence information as possible.
  • it is preferably common to at least two secondary base sequence information, more preferably common to at least five secondary base sequence information, and at least 10 secondary base sequence information. More preferably, it is common among the secondary base sequence information, more preferably common among at least 15 secondary base sequence information, and between at least 20 secondary base sequence information. It is more preferable that they are common.
  • the base sequence of polynucleotide can be determined more accurately.
  • the sixth step is a step of connecting the secondary base sequence information having the common base sequence through the common base sequence described above. By this step, the nucleotide sequence of the polynucleotide (full length or partial length) can be determined.
  • the base sequence of the polynucleotide can be determined longer.
  • a plurality of pieces of sequence information of the common base sequences searched in the fifth step may be extracted as tertiary base sequence information, and the tertiary base sequence information may be connected.
  • the base sequence of the polynucleotide can be determined with higher accuracy. That is, since the portion of “GATTC” is a portion where the base sequence is specified a plurality of times, it can be said that the reliability of the sequence is very high.
  • the apparatus for determining the base sequence of the polynucleotide of the present embodiment is an apparatus for carrying out the method for determining the base sequence of the polynucleotide of the present invention.
  • the voltage application unit 10 is configured to apply a voltage to the electrode pair 20.
  • the polynucleotide moves between the electrode pair 20 to which a voltage is applied by the voltage application unit 10, and at this time, a tunnel current is generated between the electrode pair 20.
  • the base sequence of the polynucleotide is determined based on the tunnel current.
  • the measurement unit 30 detects a plurality of tunnel current pulses generated when the polynucleotide passes between the electrode pairs 20 and measures a maximum current value and a pulse duration for each of the plurality of pulses. It is the composition.
  • the specific configuration of the measurement unit 30 is not particularly limited, and a known current measurement device may be used as appropriate.
  • At least information related to the maximum current value is sent to the primary base sequence information creation unit 40.
  • information on the reference current value of the reference nucleotide accumulated in the data storage unit 80 is also sent to the primary base sequence information creation unit 40.
  • the plurality of pulses detected by the measurement unit 30 are compared by comparing the order of magnitude between the maximum current values of the plurality of pulses with the order of magnitude between the reference current values.
  • Primary base sequence information in which each is associated with a specific type of nucleotide is created.
  • the information related to the maximum current value measured by the measurement unit 30 and the information related to the reference current value accumulated in the data storage unit 80 are compared to be detected by the measurement unit 30.
  • primary base sequence information in which each of the plurality of pulses is associated with a specific type of nucleotide may be created.
  • Specific configurations of the primary base sequence information creation unit 40 and the data storage unit 80 are not particularly limited, and a conventionally known arithmetic device such as a computer and a memory can be used.
  • the secondary base sequence information extraction unit 50 includes information on at least the pulse duration sent from the measurement unit 30, primary base sequence information sent from the primary base sequence information creation unit 40, and reference nucleotides sent from the data storage unit 80. Receive information about pulse duration. Based on this information, the secondary base sequence information extraction unit 50 extracts a pulse group composed of pulses having continuous pulse durations from a plurality of pulses, and also includes the information in the primary base sequence information. Then, a plurality of secondary base sequence information corresponding to the pulse group is extracted.
  • the secondary base sequence information extraction unit 50 may extract a plurality of secondary base sequence information corresponding to a pulse group consisting of pulses having a continuous pulse duration for a time of 1 ms or longer. Good.
  • the specific configuration of the secondary base sequence information extraction unit 50 is not particularly limited, and a conventionally known arithmetic device such as a computer can be used.
  • the common sequence search unit 60 receives a plurality of secondary base sequence information from the secondary base sequence information extraction unit 50, and is common between at least two secondary base sequence information of the plurality of secondary base sequence information. Search the base sequence.
  • the common base sequence searched by the common sequence search unit 60 may be a common base sequence information among at least 10 pieces of secondary base sequence information.
  • the specific configuration of the common sequence search unit 60 is not particularly limited, and a conventionally known arithmetic device such as a computer can be used.
  • the sequence information linking unit 70 receives the information on the common base sequence from the common sequence search unit 60 and has the common base sequence via the common base sequence. Connect base sequence information together.
  • the sequence information linking unit 70 may extract a plurality of sequence information of common base sequences searched by the common sequence search unit 60 as tertiary base sequence information, and connect the tertiary base sequence information to each other. Good.
  • the data connected by the array information connecting unit 70 is a detection result.
  • the specific configuration of the array information linking unit 70 is not particularly limited, and a conventionally known arithmetic device such as a computer can be used.
  • the voltage application unit 10 applies a voltage to the electrode pair 20. As a result, a tunnel current flows through the polynucleotide existing between the electrode pair 20.
  • the measurement unit 30 detects a plurality of pulses of the tunnel current, and measures the maximum current value and the pulse duration for each of the plurality of pulses.
  • the primary base sequence information creation unit 40 creates primary base sequence information based on the maximum current value and the like.
  • the secondary base sequence information extraction unit 50 extracts a plurality of secondary base sequence information. At this time, if a plurality of secondary base sequence information cannot be extracted, the process returns to S102. If a plurality of secondary base sequence information can be extracted at this time, the process proceeds to S106.
  • the common sequence search unit 60 searches for a base sequence common to a plurality of pieces of secondary base sequence information. At this time, when a base sequence common to a plurality of pieces of secondary base sequence information cannot be searched, the process returns to S102. If a base sequence common to a plurality of secondary base sequence information can be searched at this time, the process proceeds to S107.
  • the base sequence information is linked by the sequence information linking unit 70.
  • a calculation unit such as a CPU executes a program stored in a storage unit such as a ROM (Read Only Memory) or a RAM. It can be realized by controlling input means such as a keyboard, output means such as a display, or communication means such as an interface circuit.
  • the computer having these means reads the recording medium in which the program is recorded and executes the program, so that the configuration of the apparatus 100, the configuration provided in the apparatus 100, and the steps described above can be performed. Can be realized.
  • the various functions and various processes described above can be realized on an arbitrary computer.
  • the recording medium may be a program medium such as a memory (not shown) such as a ROM for processing by a microcomputer, or a program reading device provided as an external storage device (not shown). It may be a program medium that can be read by inserting a recording medium therein.
  • a program medium such as a memory (not shown) such as a ROM for processing by a microcomputer, or a program reading device provided as an external storage device (not shown). It may be a program medium that can be read by inserting a recording medium therein.
  • the stored program is preferably configured to be accessed and executed by a microprocessor. Furthermore, it is preferable that the program is read out, and the read program is downloaded to a program storage area of the microcomputer and the program is executed.
  • the download program is preferably stored in the main unit in advance.
  • the program medium is a recording medium configured to be separable from the main body, and is a tape medium such as a magnetic tape or a cassette tape, a magnetic disk such as a flexible disk or a hard disk, or a disk such as a CD / MO / MD / DVD.
  • Semiconductor devices such as disk systems, IC cards (including memory cards), etc., or mask ROM, EPROM (Erasable Programmable Read Only Memory), EEPROM (registered trademark) (Electrically Erasable Programmable Read Only Memory), flash ROM, etc.
  • the recording medium is preferably a recording medium that fluidly carries the program so as to download the program from the communication network.
  • the download program is stored in the main device in advance or installed from another recording medium.
  • the present invention can also be configured as follows.
  • a method for determining the base sequence of a polynucleotide of the present invention comprises a first step of passing the polynucleotide between electrode pairs, and the polynucleotide passing between the electrode pairs.
  • a fourth step of extracting a pulse group consisting of continuing pulses and extracting a plurality of secondary base sequence information corresponding to the pulse group from the primary base sequence information; and the plurality of secondary bases A fifth step of searching for a common base sequence between at least two secondary base sequence information of the sequence information, and having the common base sequence via the common base sequence And a sixth step of connecting the secondary base sequence information.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • each of the plurality of pulses is further compared by comparing the maximum current value with a reference current value corresponding to each nucleotide. It is preferable to create primary base sequence information in which is associated with a specific type of nucleotide.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • the reference current value is the highest of the maximum current values of a plurality of pulses of tunnel current generated when nucleotides are individually passed between the electrode pairs. A frequent value is preferred.
  • the base sequence of the polynucleotide can be determined with higher accuracy.
  • the electrode pair is a gold electrode
  • the order of the reference current values is as follows: dTMP ⁇ dCMP ⁇ dAMP ⁇ Methyl when the nucleotide is DNA.
  • dAMP ⁇ dGMP ⁇ Oxo-dGMP ⁇ Methyl dCMP and the nucleotide is RNA rUMP ⁇ rCMP ⁇ rAMP ⁇ rGMP may be satisfied.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • a plurality of sequence information of the common base sequences searched in the fifth step are extracted as tertiary base sequence information, and the tertiary base is extracted. It is preferable to connect the sequence information together.
  • the base sequence of the polynucleotide can be determined with higher accuracy.
  • the common base sequence searched in the fifth step is common among at least 10 pieces of secondary base sequence information. Preferably there is.
  • the base sequence of the polynucleotide can be determined with higher accuracy.
  • a plurality of secondary base sequences corresponding to a pulse group consisting of pulses having a continuous pulse duration for a time of 1 ms or longer is preferable to extract information.
  • noise can be removed and long secondary base sequence information can be obtained, so that the base sequence of the polynucleotide can be determined more efficiently.
  • the distance between the electrodes of the electrode pair is kept constant.
  • the secondary base is determined by a stochastic method. It is preferable to extract sequence information.
  • the accuracy of the secondary base sequence is likely to be uneven. In some cases, the accuracy of the secondary base sequence may be low (for example, approximately 10% or less).
  • the accuracy of the secondary base sequence information extracted by the stochastic method can be improved. That is, a more accurate secondary base sequence can be extracted.
  • the base sequence of the polynucleotide can be more accurately determined based on the data relating to the tunnel current.
  • the secondary base sequence can be extracted with a stable accuracy of about 80% or more, and the polynucleotide base sequence can be accurately determined based on the highly accurate secondary base sequence. Can be determined.
  • an apparatus for determining the base sequence of a polynucleotide of the present invention comprises an electrode pair having a distance between electrodes through which a polynucleotide can pass, and the polynucleotide passes between the electrode pair. And detecting a plurality of pulses of the tunnel current occurring in each of the plurality of pulses, measuring a maximum current value and a pulse duration for each of the plurality of pulses, and a magnitude order between the maximum current values of the plurality of pulses. And the order of magnitude between the reference current values corresponding to the electronic states due to the energy level difference between the individual nucleotides and the metal forming the electrode pair.
  • a primary base sequence information creation unit that creates primary base sequence information in which each of the above is associated with a specific type of nucleotide, and the pulse from the plurality of pulses
  • a secondary base sequence information extraction unit that extracts a pulse group including pulses having a continuous duration and extracts a plurality of secondary base sequence information corresponding to the pulse group from the primary base sequence information
  • a common sequence search unit that searches for a common base sequence between at least two pieces of secondary base sequence information of the plurality of secondary base sequence information, and the common base sequence through the common base sequence.
  • a sequence information linking unit that links the secondary base sequence information having the same base sequence.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • the primary base sequence information creating unit further compares the maximum current value with a reference current value corresponding to each nucleotide, thereby It is preferable to create primary base sequence information in which each pulse is associated with a specific type of nucleotide.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • the reference current value is the maximum of the maximum current values of a plurality of pulses of the tunnel current generated when nucleotides are individually passed between the electrode pairs. A frequent value is preferred.
  • the base sequence of the polynucleotide can be determined with higher accuracy.
  • the electrode pair is a gold electrode
  • the order of the reference current value is dTMP ⁇ dCMP ⁇ dAMP ⁇ Methyl when the nucleotide is DNA.
  • dAMP ⁇ dGMP ⁇ Oxo-dGMP ⁇ Methyl dCMP and the nucleotide is RNA rUMP ⁇ rCMP ⁇ rAMP ⁇ rGMP may be satisfied.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • the sequence information linking unit extracts a plurality of sequence information of common base sequences searched by the common sequence search unit as tertiary base sequence information, It is preferable to link the tertiary base sequence information.
  • the base sequence of the polynucleotide can be determined with higher accuracy.
  • the common base sequence searched by the common sequence search unit is common among at least 10 pieces of secondary base sequence information. It is preferable that
  • the base sequence of the polynucleotide can be determined with higher accuracy.
  • the secondary base sequence information extraction unit includes a plurality of pulses corresponding to a group of pulses each having a pulse duration continuous for a time of 1 ms or longer. It is preferable to extract secondary base sequence information.
  • noise can be removed and long secondary base sequence information can be obtained, so that the base sequence of the polynucleotide can be determined more efficiently.
  • the electrode pair is such that the distance between the electrodes is kept constant, and the secondary base sequence information extraction unit is performed by a stochastic method. It is preferable to extract the secondary base sequence information.
  • the accuracy of the secondary base sequence is likely to be uneven. In some cases, the accuracy of the secondary base sequence may be low (for example, approximately 10% or less).
  • the accuracy of the secondary base sequence information extracted by the stochastic method can be improved. That is, a more accurate secondary base sequence can be extracted.
  • the base sequence of the polynucleotide can be more accurately determined based on the data relating to the tunnel current.
  • the secondary base sequence can be extracted with a stable accuracy of about 80% or more, and the polynucleotide base sequence can be accurately determined based on the highly accurate secondary base sequence. Can be determined.
  • the present invention can be configured as follows. Of course, the following configurations can be combined with any configuration described in this specification.
  • a method for determining the base sequence of a polynucleotide of the present invention comprises a first step of passing the polynucleotide between electrode pairs, and the polynucleotide passing between the electrode pairs.
  • the fourth step of extracting base sequence information and the fifth step of searching for a base sequence common to at least two secondary base sequence information of the plurality of secondary base sequence information are common to the above.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • an apparatus for determining the base sequence of a polynucleotide of the present invention comprises an electrode pair having a distance between electrodes through which a polynucleotide can pass, and the polynucleotide passes between the electrode pair. And detecting a plurality of pulses of the tunnel current generated in each of the plurality of pulses, and measuring a maximum current value and a pulse duration for each of the plurality of pulses, the maximum current value, and a reference current corresponding to each nucleotide
  • a primary base sequence information creation unit that creates primary base sequence information in which each of the plurality of pulses is associated with a specific type of nucleotide by comparing the values, and the pulse duration from the plurality of pulses.
  • a common sequence for searching for a common base sequence between a secondary base sequence information extraction unit for extracting a number of secondary base sequence information and at least two secondary base sequence information of the plurality of secondary base sequence information A search unit; and a sequence information linking unit that links the secondary base sequence information having the common base sequence through the common base sequence. It is said.
  • the base sequence of the polynucleotide can be determined based on the data relating to the tunnel current.
  • Electrode pair The electrode pair shown in FIG. 1 was formed using a nano-machined mechanical fracture joining method (MCBJ) (Tsutsui, M., Shoji, K., Taniguchi, M., Kawai, T., Formation and self-breaking mechanism of stable atom-sized junctions. See Nano Lett. 8, 345-349 (2007)). Below, the manufacturing method of an electrode pair is demonstrated easily.
  • MBJ nano-machined mechanical fracture joining method
  • Nanoscale gold bonding is performed using standard electron beam lithography and lift-off technology using an electron beam lithography system (manufactured by JEOL Ltd., catalog number: JSM6500F).
  • Polyimide manufactured by Industrial Summit Technology, catalog number: Pyre- A pattern was formed on a flexible metal substrate (phosphor bronze substrate) coated with (Ml).
  • the polyimide under the bonding was removed by etching based on the reactive ion etching method using a reactive ion etching apparatus (manufactured by Samco, catalog number: 10NR). Then, by bending the metal substrate, a nanoscale gold bridge having a structure bent at three points was produced. Such bending of the substrate was performed using a piezo actuator (manufactured by CEDRAT, catalog number: APA150M).
  • the bridge was pulled and a part of the bridge was broken to form an electrode pair (gold electrode).
  • a resistance of 10 k ⁇ is connected in series under a programmed junction pulling speed by a resistance feedback method.
  • Vb DC bias voltage
  • the bridge was further pulled, and the size of the gap (distance between the electrodes) generated by the breakage was set to be the length of the target nucleotide molecule (about 1 nm).
  • the electrode pair was immersed in Milli-Q water in which the nucleotide or polynucleotide was dissolved, and the tunnel current generated when the nucleotide or polynucleotide was trapped between the electrode pair was measured.
  • the nucleotide or polynucleotide concentration in Milli-Q water was 0.10 ⁇ M.
  • a tunneling current flowing between an electrode pair having an interelectrode distance of 0.80 nm is converted into a logarithmic amplifier (Rev. Sci. Instrum. 68 (10) at 10 kHz under a DC bias voltage of 0.4V. , 3816, manufactured by Daiwa Giken Co., Ltd.) and PXI 4071 digital multimeter (National Instruments). Each sample was measured until 200 or 1000 pulses were detected, and these pulses were analyzed.
  • dAMP deoxyribonucleoside monophosphate
  • CMP deoxycytidine-5'-monophosphate sodium salt: Sigma-Aldrich
  • DGMP DGMP
  • dTMP Thimidylic acid disodium salt: Tokyo Chemical Industry Co.
  • TCI ribonucleoside monophosphate
  • rAMP ribonucleoside monophosphate
  • rCMP cytidine 5'-monophosphate disodium salt: TCI
  • rGMP Guanosine 5'-monophosphate sodium salt hydrate: TCI
  • rUMP uridine 5'-
  • TCI monophosphate disodium salt hydrate
  • each of the deoxyribonucleoside monophosphate or ribonucleotide monophosphate was added to Milli-Q water so that the final concentration was 0.10 ⁇ M to prepare a measurement solution.
  • a voltage of 0.4 V was applied between the nanogap electrodes in a state where the measurement solution was filled in the space between the electrodes, and a tunnel current generated between the electrodes at this time was measured.
  • deoxyribonucleoside monophosphate or ribonucleoside monophosphate present between the electrodes is performing Brownian motion (the temperature of the measurement solution was about 25 ° C.).
  • FIG. 2 (a) shows tunneling current data measured over time when a measurement solution containing dGMP is used. As shown in FIG. 2A, a plurality of tunnel current pulses were observed with time. The magnitude of the tunnel current was about 10 pA to about 100 pA.
  • FIG. 2B illustrates one of a plurality of tunnel current pulses shown in FIG.
  • each pulse can be defined by Ip (maximum current value) and td (pulse duration).
  • Ip maximum current value
  • td pulse duration
  • a conductance (Ip / V) histogram was prepared using about 1000 pulses for each deoxyribonucleoside monophosphate and each ribonucleoside monophosphate. A Gaussian distribution was used to create the conductance (Ip / V) histogram.
  • G value peak value of conductance (Ip / V) histogram
  • DCMP 60 pS
  • dTMP 39 pS
  • rGMP 123 pS
  • rAMP 92 pS
  • rCMP 64 pS
  • rUMP 50 pS.
  • the highest occupied molecular orbital energy is -5.7 eV for guanine, -5.9 eV for adenine, and -6.1 eV for cytosine.
  • Thymine was -6.6 eV and uracil was -6.9 eV.
  • the order of molecular orbital energies is the same as the order of relative G values described above. This indicates that the method for determining the type of nucleic acid monomer based on the tunnel current can specify the type of molecule based on the energy level (particularly, the HOMO energy level).
  • Table 2 shows another test result measured under the same experimental conditions.
  • nucleic acid sequence of DNA oligomer > ⁇ 3.
  • a similar test was performed using a DNA oligomer (specifically, TGT, GTG, ATA, CAC, or GAG) instead of the nucleic acid monomer. went.
  • td pulse duration
  • FIG. 3 (a) shows a DNA oligomer tunneling current pulse that appears over time.
  • the DNA oligomer filed a pulse group having a relative G value at substantially the same level as dGMP.
  • Fig. 3 (d) to Fig. 3 (f) show the results of automatically extracting electrical signals. In these figures, a clear pulse with three plateau peaks is observed.
  • the first position and the third position have low plateau-like peaks indicating T, and G is indicated at the second position. A pulse with a high plateau peak is detected.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Nanotechnology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Cell Biology (AREA)

Abstract

 ポリヌクレオチドが電極対の間を通過するときに生じるトンネル電流の複数のパルスの各々について、最大電流値とパルス持続時間とを測定し、当該最大電流値およびパルス持続時間に基づいて、ポリヌクレオチドの塩基配列を決定する。

Description

ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置
 本発明は、ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置に関する。より具体的には、ポリヌクレオチドが電極対の間を通過するときに生じるトンネル電流に基づいて、ポリヌクレオチドの塩基配列を決定する方法、および、当該方法を実施するための装置に関する。
 ポリヌクレオチドの塩基配列を分析する技術は、単に学術的な研究の分野に留まらず、医療、創薬、および犯罪捜査などの分野にまで応用されており、この技術の発展に対して関心が高まっている。
 従来のポリヌクレオチド(具体的にはDNA)のシーケンサーは、蛍光標識を識別するという光測定技術に基づいており、ポリヌクレオチドを形成しているヌクレオチドそのものを直接的に識別するものではない。それ故に、従来のシーケンサーによってポリヌクレオチドの塩基配列を分析しようとすれば、当該ポリヌクレオチドを鋳型としてPCRを行うとともに、当該PCRによって伸長されるポリヌクレオチドに対して蛍光標識を付加する必要がある。この作業には、多数の試薬が必要となるだけでなく、多くの時間も必要となる。それ故に、従来のシーケンサーによるポリヌクレオチドの塩基配列の分析には、多大な資金と時間とが必要になる。
 そこで、過去十数年の間、1分子のポリヌクレオチドを用いて、当該ポリヌクレオチドを構成しているヌクレオチドを直接的に分析する技術を開発しようとする試みがなされている。
 例えば、化学的に設計されたαヘモリシンのナノスケールのポア(以下、「ナノポア」と称する。)を用いたイオン電流の検出によって、ポリヌクレオチドの塩基配列を分析する技術を開発しようとする試みがなされている(非特許文献1~5参照)。しかしながら、当該技術は、(1)ポアサイズの選択が限定されている、(2)システムが不安定である、等の多くの問題点を有しており、実用化の目処が立っていない。
 このような状況下において、非常に狭い電極対の間のスペースをポリヌクレオチドが通過する際に発生する「トンネル電流」に基づいて、ポリヌクレオチドの塩基配列を分析しようとする、新たな試みがなされている(例えば、特許文献1、非特許文献6参照)。当該技術は「イオン電流」とは全く異なる電流であるトンネル電流に基づいてポリヌクレオチドの塩基配列を分析する技術であって、非特許文献1~5などに記載の技術とは全く思想が異なる技術である。
WO2011/108540 A1(公開日:2011年9月9日)
J. Li, D. Stein, C. McMullan, D. Branton, M. J. Aziz, J. A. Golovchenko, Nature 412, 166(2001) A. J. Storm, J. H. Chen, X. S. Ling, H. W. Zandbergen, C. Dekker, Nature Mat. 2, 537(2003) C. Dekker, Nat. Nanotechnol. 2, 209(2007) D. Branton, D. W. Deamer, A. Marziali, H. Bayley, S. A. Benner, T. Butler, M. Di Ventra, S. Garaj, A. Hibbs, X. Huang, S. B. Jovanovich, P. S. Krstic, S. Lindsay, X. S. Ling, C. H. Mastrangelo, A. Meller, J. S. Oliver, Y. V. Pershin, J. M. Ramsey, R. Riehn, G. V. Soni, V. Tabard-Cossa, M. Wanunu, M. Wiggin, J. A. Schloss, Nat. Biotech. 26, 1146(2008) M. Zwolak, M. Di Ventra, Rev. Mod. Phys. 80, 141(2008) Nature Nanotechnology, 2010, April, 5(4), 286-290
 しかしながら、上述したトンネル電流に基づいてポリヌクレオチドの塩基配列を分析する技術は、ヌクレオチドまたは短いポリヌクレオチドの塩基配列を決定することには適しているが、当該技術を用いて長いポリヌクレオチドの塩基配列を決定するための方法が確立されておらず、それ故に、早急に当該方法を確立する必要があった。
 本発明は、上記の問題点に鑑みてなされたものであり、その目的は、トンネル電流に基づいてポリヌクレオチドの塩基配列を分析する技術を用いて、長いポリヌクレオチドの塩基配列を決定するための方法および装置を確立することにある。
 本発明のポリヌクレオチドの塩基配列を決定する方法は、上記課題を解決するために、ポリヌクレオチドの塩基配列を決定する方法であって、上記ポリヌクレオチドを、電極対の間を通過させる第1工程と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する第2工程と、上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する第3工程と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する第4工程と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する第5工程と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる第6工程と、を有することを特徴としている。
 本発明のポリヌクレオチドの塩基配列を決定する装置は、上記課題を解決するために、ポリヌクレオチドが通過可能な電極間距離を有する電極対と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する測定部と、上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する一次塩基配列情報作成部と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する二次塩基配列情報抽出部と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する共通配列検索部と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる配列情報連結部と、を備えていることを特徴としている。
 本発明は、DNAのようなポリヌクレオチドから直接的に塩基配列の情報を読み取ることができることは勿論のこと、RNAのようなポリヌクレオチドからも直接的に塩基配列の情報を読み取ることができるという効果を奏する。
 本発明は、従来技術において必要であったポリヌクレオチド(例えば、DNA)の抽出作業および精製作業を省略することができるとともに、当該ポリヌクレオチドを用いたPCR反応を省略することができるので、簡便にかつ短時間にてポリヌクレオチドの塩基配列を決定することができるという効果を奏する。
 本発明は、従来のショットガンシークエンス法のようなポリヌクレオチドの切断処理を必要としないので、簡便にかつ短時間にてポリヌクレオチドの塩基配列を決定することができるという効果を奏する。
 本発明は、修飾を受けたポリヌクレオチド、または、損傷を受けたポリヌクレオチドであったとしても、その塩基配列を決定することができるという効果を奏する。
 本発明は、遺伝子の発現情報、および、老化または疾患にかかわるエピジェネティックな情報を、ポリヌクレオチドから直接得ることができるという効果を奏する。
 本発明は、ごく微量のポリヌクレオチド(例えば、1分子のDNAまたはRNA)であったとしても、その塩基配列を決定することができるという効果を奏する。
 本発明は、生体分子を必要としない、機械的な強度が高い電極を用いて塩基配列を決定するので、安定してポリヌクレオチドの塩基配列を決定することができるという効果を奏する。
 本発明は、例えば、生体分子が変性するような条件下(例えば、DNAまたはRNAが分子間などに形成する水素結合を切断するような高温条件下)であったとしても、安定してポリヌクレオチドの塩基配列を決定することができるという効果を奏する。
 本発明は、電極間へポリヌクレオチドを積極的に導入するための装置や、電極を洗浄するための装置を必要としないので、小型の装置によってポリヌクレオチドの塩基配列を決定することができるとともに、安価にポリヌクレオチドの塩基配列を決定することができるという効果を奏する。
電極対の間を通過しているポリヌクレオチドを示す模式図である。 本発明の実施例の各種データを示すグラフである。 本発明の実施例の各種データを示すグラフである。 本発明の実施例の各種データを示すグラフである。 本発明の実施例のポリヌクレオチドの塩基配列を決定する装置の構成の一例を示すブロック図である。 本発明の実施例のポリヌクレオチドの塩基配列を決定する装置の動作の一例を示すフローチャートである。
 以下に、本発明の一実施形態について説明するが、本発明はこれに限定されるものではない。
 〔1.ポリヌクレオチドの塩基配列を決定する方法〕
 本発明のポリヌクレオチドの塩基配列を決定する方法は、以下の第1工程~第6工程を包含している。つまり、
・第1工程:ポリヌクレオチドを、電極対の間を通過させる工程。
・第2工程:ポリヌクレオチドが電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する工程。
・第3工程:複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチド(参照ヌクレオチドと呼ぶ)と電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程。
・第4工程:複数のパルスの中から、パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する工程。
・第5工程:複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する工程。
・第6工程:共通している塩基配列を介して、当該共通している塩基配列を有している二次塩基配列情報同士を繋ぎ合わせる工程。
 以下に、各工程について説明する。
  〔1-1.第1工程〕
 第1工程は、ポリヌクレオチドを、電極対の間を通過させる工程である。
 本明細書中で使用される場合、用語「ポリヌクレオチド」は、「オリゴヌクレオチド」、「遺伝子」と交換可能に使用され、ヌクレオチドの重合体が意図される。なお、本明細書中で使用される場合、「オリゴヌクレオチド」は、2~数十個、より具体的には、2~50個のヌクレオチドからなるものが意図される。「ポリヌクレオチド」は、数十個以上、具体的には、50個よりも多くのヌクレオチドからなるものが意図される。
 上記ポリヌクレオチドを構成するヌクレオチドとしては特に限定されず、任意のリボヌクレオチドであってもよいし、任意のデオキシリボヌクレオチドであってもよい。また、上記ポリヌクレオチドを構成するヌクレオチドは、リボヌクレオチドまたはデオキシリボヌクレオチドが化学修飾(例えば、メチル化、オキソ化、ヒドロキシル化、ホルミル化、カルボキシ化、ダイマー化、塩基脱離化等)を受けたものであってもよい。
 リボヌクレオチドとしては、特に限定されないが、アデノシン一リン酸(rAMP)、アデノシン二リン酸(rADP)、アデノシン三リン酸(rATP)、グアノシン一リン酸(rGMP)、グアノシン二リン酸(rGDP)、グアノシン三リン酸(rGTP)、シチジン一リン酸(rCMP)、シチジン二リン酸(rCDP)、シチジン三リン酸(rCTP)、ウリジン一リン酸(rUMP)、ウリジン二リン酸(rUDP)、およびウリジン三リン酸(rUTP)などが挙げられる。
 デオキシリボヌクレオチドとしては、特に限定されないが、デオキシアデノシン一リン酸(dAMP)、デオキシアデノシン二リン酸(dADP)、デオキシアデノシン三リン酸(dATP)、デオキシグアノシン一リン酸(dGMP)、デオキシグアノシン二リン酸(dGDP)、デオキシグアノシン三リン酸(dGTP)、デオキシシチジン一リン酸(dCMP)、デオキシシチジン二リン酸(dCDP)、デオキシシチジン三リン酸(dCTP)、デオキシウリジン一リン酸(dUMP)、デオキシウリジン二リン酸(dUMP)、デオキシウリジン二リン酸(dUTP)、デオキシチミジン一リン酸(dTMP)、デオキシチミジン二リン酸(dTDP)、およびデオキシチミジン三リン酸(dTTP)などが挙げられる。
 化学修飾を受けたリボヌクレオチドまたはデオキシリボヌクレオチドとしては、特に限定されないが、メチルシトシン、メチルアデニン、オキソグアニン、ヒドロキシメチルシトシン、チミンダイマー、メチルアデニン、ホルミルシトシン、および、リボヌクレオチドまたはデオキシリボヌクレオチドから塩基が脱離したものなどが挙げられる。
 第1工程では、上述したポリヌクレオチドを溶液中に溶解させて、上記電極対を形成する電極の間に当該溶液を充填すること、または、電極対を上記溶液中に保持することによって、ポリヌクレオチドを、電極対の間を通過させればよい。
 上記溶液としては、特に限定されないが、例えば、超純水が挙げられる。超純水は、例えば、ミリポア社のMilli-Q Integral 3(装置名)(Milli-Q Integral 3/5/10/15(カタログ番号))を用いることによって作製することができる。溶液中のポリヌクレオチドの濃度は、特に限定されないが、例えば、0.01~1.0μMである。勿論、溶液中に1分子のポリヌクレオチドが含まれていれば、当該ポリヌクレオチドの塩基配列を分析することができる。
 第1工程では、電極対の間に電圧を印加する。これによって、当該電極対の間をポリヌクレオチドが通過するときに当該電極対を形成する電極間にトンネル電流が発生する。印加する電圧は、特に限定されず、例えば、0.25V~0.75Vであり得る。
 第1工程では、上述したポリヌクレオチドを、電極対の間を通過させる。
 ポリヌクレオチドを電極対の間を通過させる具体的な方法は特に限定されないが、例えば、熱拡散(換言すれば、ブラウン運動)または交流電圧などによってポリヌクレオチドを移動させ、当該移動によって、電極対の間を通過させることが可能である。これらの中では、熱拡散によってポリヌクレオチドを移動させ、当該移動によって、電極対の間を通過させることが好ましい。上記構成によれば、ポリヌクレオチドが長時間、電極対の間に存在することが可能になるので、ポリヌクレオチドの部分配列の情報をより多く得ることができる。そして、その結果、ポリヌクレオチドの塩基配列を、より長く、かつ、より精度よく決定することができる。
 ポリヌクレオチドを熱拡散させる場合の温度は特に限定されず、適宜設定することができる。例えば、5℃~70℃であることが好ましく、20℃~50℃であることが更に好ましい。
 従来技術とは異なり、本発明はタンパク質によって形成されたポアを有する電極を必要としないので、たとえ高温にてポリヌクレオチドを熱拡散させたとしても、電極が機能を失うことはない。更に、ポリヌクレオチドを高温にて熱拡散させれば、ポリヌクレオチドが分子間で相互作用(例えば、水素結合)することを防止することができる。つまり、ポリヌクレオチドを高温にて熱拡散させれば、ポリヌクレオチドが2本鎖を形成することを防止することができる。その結果、より正確に、ポリヌクレオチドの塩基配列を決定することができる。
 次いで、本実施の形態に用いる電極対について説明する。
 本実施の形態を実施するためには、ポリヌクレオチドが通過した際に電極対の間にトンネル電流を生じさせることが必要である。このようなトンネル電流が生じるためには、電極対の間の距離が重要である。電極対の間の距離が、ポリヌクレオチドを構成する各ヌクレオチドの分子直径よりも長すぎると、電極対の間にトンネル電流が流れにくくなったり、2つ以上のポリヌクレオチドが、同時に電極対の間に入り込んだりする。反対に、電極対の間の距離がポリヌクレオチドを構成する各ヌクレオチドの分子直径よりも短すぎると、電極対の間にポリヌクレオチドが入り込めなくなる。
 電極対の間の距離がポリヌクレオチドを構成するヌクレオチドの分子直径よりも長すぎたり、短すぎたりすると、ポリヌクレオチドを構成する各ヌクレオチド1分子を介したトンネル電流に由来するパルスを検出することが困難になる。よって、電極対を形成する電極間の距離は、ポリヌクレオチドを構成するヌクレオチドの分子直径よりも少し短いか、等しいか、または、それよりも少し長い程度であることが好ましい。例えば、電極間の距離は、ヌクレオチドの分子直径の0.5倍~2倍の長さであり、1倍~1.5倍の長さであることが好ましく、1倍~1.2倍の長さであることがより好ましい。
 ヌクレオチドの分子直径は当業者に公知であるため、本明細書に接した当業者であれば、最適な電極対の間の距離を適宜選択することができる。例えば、一リン酸の形態のヌクレオチドの分子直径は約1nmであるため、当該分子直径を基準として、電極対の間の距離を、例えば0.5nm~2nm、好ましくは1nm~1.5nm、より好ましくは1nm~1.2nmに設定すればよい。
 また、上記電極対は、電極間の距離が一定に保たれているもの(または、電極間の距離が一定にコントロールされ得るもの)であることが好ましい。つまり、上記電極対は、トンネル電流を測定している時に電極間の距離が変化しないものであることが好ましい。
 例えば、電極間の距離の変化率が1%以下であるものが好ましく、0.1%以下であるものが更に好ましく、0.01%以下であるものが更に好ましく、0.001%以下であるものが更に好ましい。
 従来の技術で作製された電極対は、肉眼で観察した場合には一見すると電極間の距離が一定に保たれているように見えるが、実際には電極間の距離が微細に変化している。そして、微細であったとしても電極間の距離が変化すると、トンネル電流の値が変動する。つまり、同じ物質に由来するトンネル電流の値が変化してしまい、ポリヌクレオチドの塩基配列の決定精度が低くなってしまう。
 一方、電極間の距離が一定に保たれ得る電極対を用いれば、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
 なお、このような電極対は、本発明者が開発した技術(例えば、後述するナノ加工機械的破断接合法)によって容易に作製することができる。当該技術の詳細については、後述する。
 上記電極対の具体的な作製方法は特に限定されない。以下に、作製方法の一例を示す。
 上述した電極対は、公知のナノ加工機械的破断接合法(nanofabricated mechanically-controllable break junctions)を用いることによって作製することができる。このナノ加工機械的破断接合法は、ピコメーター以下の分解能にて、機械的安定性に優れた電極間距離を制御することができる優れた方法である。ナノ加工機械的破断接合法を用いた電極対の作製方法は、例えば、J. M. van Ruitenbeek, A. Alvarez, I. Pineyro, C. Grahmann, P. Joyez, M. H. Devoret, D. Esteve, C. Urbina, Rev. Sci. Instrum. 67, 108(1996)またはM. Tsutsui, K. Shoji, M. Taniguchi, T. Kawai, Nano Lett. 8, 345(2008)に記載されている。電極の材料としては、金などの任意の金属が挙げられる。
 例えば、以下に示す手順によって電極対を作製することができる。
 まず、ナノスケールの金の接合を、電子線描画装置(日本電子社製、カタログ番号:JSM6500F)を用いて、公知の電子ビームリソグラフィーおよびリフトオフ技術によって、ポリイミドでコーティングされた可撓性の金属基板上にパターン成形する。次いで、この接合の下にあるポリイミドを、反応性イオンエッチング装置(サムコ社製、カタログ番号:10NR)を用いて、公知のエッチング法(反応性イオンエッチング法など)に基づくエッチングによって取り除く。
 そして、基板を折り曲げることによって、3点にて折り曲げられた構造のナノスケールの金のブリッジを作製する。この場合、ピエゾアクチュエータ(CEDRAT社製、カタログ番号:APA150M)を用いて基板の折曲げを精密に操作することによって、電極対の電極間距離をピコメーター以下の分解能にて制御することができる。
 次いで、作製したこのブリッジを引っ張り。ブリッジの一部を破断させる。さらにブリッジを引っ張り、破断によって生じたギャップの大きさ(電極間距離)が目的のヌクレオチド分子の長さ(約1nm)になるように設定する。この場合、自己破断技術を利用してブリッジの引っ張りを調節することによって電極対の電極間距離を正確に制御することができる(M. Tsutsui, K. Shoji, M. Taniguchi, T. Kawai, Nano Lett. 8, 345(2008)、およびM. Tsutsui, M. Taniguchi, T. Kawai, Appl. Phys. Lett. 93, 163115(2008)参照)。
 具体的には、データ集録ボード(ナショナルインスツルメンツ社製、カタログ番号:NIPCIe-6321)を用いて、レジスタンスフィードバック法(M. Tsutsui, K. Shoji, M. Taniguchi, T. Kawai, Nano Lett. 8, 345(2008)、およびM. Tsutsui, M. Taniguchi, T. Kawai, Appl. Phys. Lett. 93, 163115(2008)参照)によって、プログラミングされた接合の引き延ばし速度の下で、10kΩの直列の抵抗を用いて、0.1VのDCバイアス電圧(V)をこのブリッジに印加して、金のナノ接合を引っ張り、ブリッジを破断させる。そして、ブリッジをさらに引っ張り、破断によって生じたギャップの大きさ(電極間距離)が目的のヌクレオチド分子の長さになるように設定する。このようにして、電極対を形成する。
  〔1-2.第2工程〕
 第2工程は、ポリヌクレオチドが電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する工程である。
 第2工程にて検出されるパルスの数は特に限定されないが、多ければ多いほど、ポリヌクレオチドの全長の塩基配列を精度良く決定することができる。なお、検出されるパルスの数を多くするためには、例えば、トンネル電流を測定する時間を長くすればよい。トンネル電流を測定する時間は限定されないが、例えば、10分間、20分間、30分間、40分間、50分間、1時間であり得る。上記時間は、ポリヌクレオチドの長さに応じて適宜設定すればよい。
 以下では、トンネル電流の具体的な測定方法について説明する。
 例えば、ポリヌクレオチドが溶解した溶液中に電極対を保持し、電極対の間に電圧(例えば、0.25V~0.75V)を印加すれば、ポリヌクレオチドが電極対の間を通過したときに、ポリヌクレオチドを構成するヌクレオチドに起因するトンネル電流が電極対の間に生じる。トンネル電流(複数のトンネル電流)が生じるメカニズムを以下にて説明する。
 ポリヌクレオチドが電極対の間に進入すると、まず、ポリヌクレオチドを構成する何れかのヌクレオチド(以下、1番目のヌクレオチドと呼ぶ)が電極間に捕捉される。1番目のヌクレオチドが電極間に捕捉されたときに、1番目のヌクレオチドに起因するトンネル電流が電極間に生じる。
 なお、当該1番目のヌクレオチドは、ポリヌクレオチドの5’末端のヌクレオチドである場合もあるし、ポリヌクレオチドの3’末端のヌクレオチドである場合もあるし、5’末端と3’末端との間に存在するヌクレオチドである場合もある。
 その後、1番目のヌクレオチドが電極対の間を完全に通過した後に、別のヌクレオチドが電極間に捕捉される(以下、2番目のヌクレオチドと呼ぶ)。2番目のヌクレオチドが電極対の間に捕捉されたときに、2番目のヌクレオチドに起因するトンネル電流が電極対の間に生じる。
 なお、上記2番目のヌクレオチドは、上記1番目のヌクレオチドに隣接しているヌクレオチドである場合もあるし、上記1番目のヌクレオチドに隣接していないヌクレオチドである場合もある。2番目のヌクレオチドが1番目のヌクレオチドに隣接しているヌクレオチドであるか否かはパルス持続時間に基づいて判定することが可能であり、この点については後述する。
 以上のようにして、ポリヌクレオチドを構成するヌクレオチドに起因するトンネル電流が電極対の間に生じる。
 そして、ポリヌクレオチドが電極対の間を通過すると(ポリヌクレオチドを構成する最後のヌクレオチドが電極対から解離すると)、電極対の間に生じていたトンネル電流が消失する。
 電極対の間に生じるトンネル電流の測定は、公知の電流計を用いて測定することができる。また、電流増幅器を用いて、トンネル電流のシグナルを一旦増幅してもよい。電流増幅器を用いることによって、微弱なトンネル電流の値を増幅することができるため、トンネル電流を高感度に測定することが可能となる。電流増幅器としては、例えば、市販の可変高速電流アンプ(Femto社製、カタログ番号:DHPCA-100)が挙げられる。
 電極対の間に流れるトンネル電流を所定の時間測定して、トンネル電流の電流値が基底レベルを超えているか否かを経時的に判定することによって、トンネル電流のパルスを検出することができる。具体的には、上述の判定にしたがって、トンネル電流が基底レベルを超えた時間を特定し、そして再び基底レベルに戻った時間を特定すれば、これらの2つの時間の間のシグナルをヌクレオチドに起因するトンネル電流のパルスとして検出することができる。測定したトンネル電流の電流値とトンネル電流の測定時間との関係を示すグラフ(例えば、曲線グラフ)を用いれば、このような判定を目視にて容易に行うことができる。
 図2(b)に、トンネル電流のパルスの一例を示す。図2(b)に示すように、測定したトンネル電流の電流値とトンネル電流の測定時間との関係を示すグラフから、各パルスの最大電流値(Ip)とパルス持続時間(tp)とを算出することができる。
  〔1-3.第3工程〕
 第3工程は、複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチド(参照ヌクレオチドと呼ぶ)と電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程である。
 また、第3工程は、複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチド(参照ヌクレオチドと呼ぶ)の参照電流値の間の大小の順番と、を比較することによって、複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程であってもよい。
 例えば、構造が既知である4種類の参照ヌクレオチドの各々の参照電流値A、B、CおよびDが予め決定され、その大小関係がA<B<C<Dであったとする。そして、測定された複数のパルスの最大電流値の各々がa、b、cまたはdに分類することができ、かつ、これらの最大電流値にa<b<c<dの大小関係があったとする。
 この場合、最大電流値aに対応するヌクレオチドと、参照電流値Aに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができ、最大電流値bに対応するヌクレオチドと、参照電流値Bに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができ、最大電流値cに対応するヌクレオチドと、参照電流値Cに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができ、最大電流値dに対応するヌクレオチドと、参照電流値Dに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができる。
 参照ヌクレオチドの構造は既知であるので、測定された各パルスを特定の種類のヌクレオチドに対応づけることができる。
 なお、上記第3工程は、複数のパルスの最大電流値の種類(上述した例では、4種類)と、参照電流値の種類(上述した例では、4種類)とが、同じ数であるか否かを判定する工程を包含していてもよい。複数のパルスの最大電流値の種類と、参照電流値の種類とが同じ数である場合には、より精度高くポリヌクレオチドの塩基配列を決定することができる。
 参照電流値の大小関係は電極対の材料に応じて決定され得る。
 例えば、電極対が金電極である場合には、参照電流値の大小の順番は、ヌクレオチド(参照ヌクレオチド)がDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo-dGMP<Methyl dCMPであり、ヌクレオチド(参照ヌクレオチド)がRNAである場合には、rUMP<rCMP<rAMP<rGMPであり得る。勿論、本発明は、これに限定されない。
 第3工程は、第2工程にて測定された最大電流値と、個々のヌクレオチド(以下、参照ヌクレオチドと称する)に対応する参照電流値とを比較することによって、ポリヌクレオチドから検出された複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程であってもよいし、当該工程を包含していてもよい。
 つまり、当該第3工程では、予め測定されている参照ヌクレオチドの最大電流値の最頻値(換言すれば、参照電流値)と、ポリヌクレオチドにて実際に測定された各パルスの最大電流値とを比較することによって、各パルスを特定の種類のヌクレオチドに対応付ける。そして、これによって、第2工程にて測定された最大電流値の情報が、一次塩基配列情報へ置換される。
 つまり、当該第3工程では、ポリヌクレオチドにて実際に測定されたパルスの最大電流値が、特定の参照ヌクレオチドの最大電流値の最頻値(換言すれば、参照電流値)と一致すれば、上記パルスを発しているポリヌクレオチド内のヌクレオチドが、上記特定の参照ヌクレオチドと同一であると判定することができる。
 上記参照ヌクレオチドとは、ポリヌクレオチドを構成している可能性があるヌクレオチドを意図する。具体的には、〔1-1.第1工程〕の欄にてポリヌクレオチドを構成し得るヌクレオチドとして記載した、任意のリボヌクレオチド、任意のデオキシリボヌクレオチド、および、これらが化学修飾(例えば、メチル化、オキソ化、ヒドロキシル化、ホルミル化、カルボキシ化、ダイマー化、塩基脱離化等)を受けたものであり得る。更に具体的なヌクレオチドの例は、〔1-1.第1工程〕の欄にて既に説明したので、ここではその説明を省略する。
 上記参照電流値は、参照ヌクレオチドを個別に電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値の最頻値として求めることができる。なお、参照電流値を求めるときに用いる電極対は、ポリヌクレオチドの塩基配列を決定するために用いる電極対と同じ電極を用いることが好ましい。当該構成であれば、参照電流値を求めるときの測定条件と、ポリヌクレオチドの塩基配列を決定するときの測定条件とを同一にすることができるので、精度良く、ポリヌクレオチドの塩基配列を決定することができる。
 つまり、本発明では、電極対を作製したら、まず、様々な参照ヌクレオチドに関する参照電流値を求めるとともに当該参照電流値のデータをデータベース化し、実際にポリヌクレオチドの塩基配列を決定するときには、ポリヌクレオチドに由来する各パルスの最大電流値と上記データベース化された参照電流値とを比較することによって、ポリヌクレオチドに由来する各パルスがどの参照ヌクレオチドに対応するか決定すればよい。
 以下に、参照電流値を求める方法について、具体的に説明する。
 参照電流値を求める場合には、参照ヌクレオチドを個別に、複数回、電極対の間を通過させ、各参照ヌクレオチドについて複数のトンネル電流を測定し、当該複数のトンネル電流値の最大電流値を求め、最も頻度良く出現する最大電流値を参照電流値とすればよい。
 まず、参照ヌクレオチドを、個別に溶液(例えば、ポリヌクレオチドを溶解する溶液と同じ溶液)中に溶解させる。
 電極対を参照ヌクレオチドが溶解した溶液中に保持し、電極対の間に電圧を印加すれば、参照ヌクレオチドが通過するときに、電極対の間に参照ヌクレオチドが捕捉される。電極対の間に参照ヌクレオチドが捕捉されている間(電極間に参照ヌクレオチドが滞在する間)、電極対の間にトンネル電流が生じる。電極対の間に捕捉された参照ヌクレオチドは、所定の時間が経過すると自発的に電極対から解離する。参照ヌクレオチドが電極対から解離することによって、電極間に生じていたトンネル電流が消失する。このように、参照ヌクレオチドが電極対の間に捕捉され、電極対の間から解離することによって、トンネル電流のパルスが発生する。そして、当該捕捉と解離とを繰り返すことによって、各参照ヌクレオチドについて、複数のトンネル電流のデータが得られる。
 電極対の間に電圧を印加する方法は、特に限定されず、例えば、公知の電源装置を電極対に接続して、電極対の間に電圧(例えば、バイアス電圧)を印加すればよい。印加する電圧は、特に限定されず、ポリヌクレオチドの塩基配列を決定するときと同じ電圧を用いればよい。例えば、0.25V~0.75Vである。
 このようにして、参照ヌクレオチドが溶解した溶液中に保持された電極対の間に電圧を印加して、これによって電極対の間に生じたトンネル電流の電流値を所定の時間測定すればよい。トンネル電流の電流値は、例えば、50分間測定すればよい。
 電極対の間に生じたトンネル電流は、公知の電流計を用いて測定することができる。また、例えば電流増幅器を用いてトンネル電流のシグナルを一旦増幅してもよい。電流増幅器を用いることによって、微弱なトンネル電流の値を増幅することができるため、トンネル電流を高感度に測定することが可能となる。電流増幅器としては、例えば、市販の可変高速電流アンプ(Femto社製、カタログ番号:DHPCA-100)が挙げられる。
 このように、電極対の間に流れるトンネル電流を所定の時間測定して、トンネル電流の電流値が基底レベルを超えているか否かを経時的に判定することによって、トンネル電流のパルスを検出することができる。具体的には、上述の判定にしたがって、トンネル電流が基底レベルを超えた時間を特定し、そして再び基底レベルに戻った時間を特定すれば、これらの2つの時間の間のシグナルを参照ヌクレオチドに起因するトンネル電流のパルスとして検出することができる。測定したトンネル電流の電流値とトンネル電流の測定時間との関係を示すグラフ(例えば、曲線グラフ)を用いれば、このような判定を目視にて容易に行うことができる。
 このようにして検出した参照ヌクレオチドに起因するパルスには、種々の高さのピークが存在する。これらのピークは、電極対の間における参照ヌクレオチドの運動に基づく電極と参照ヌクレオチドとの距離の変化に起因して出現する。すなわち、参照ヌクレオチドと電極との距離が短くなれば、トンネル電流が生じやすくなるため、トンネル電流の電流値が増加する。一方、参照ヌクレオチドと電極との距離が長くなれば、トンネル電流が生じにくくなるため、トンネル電流の電流値が減少する。このように、参照ヌクレオチドが電極対の間において運動することによって、電極と参照ヌクレオチドとの距離が変化し、トンネル電流の電流値が増減するため、トンネル電流のパルスに複数の種類のピークが現れる。
 このようにして検出した各パルスの最も高いピークの電流値から基底レベルを引くことによって、各パルスの最大電流値を求めることができる。そして、求めた各最大電流値に対して統計分析を行うことによって最頻値を算出することができる。
 最頻値を求めるためには、例えば、最大電流値の値と、当該値を有するパルスの数との関係を示すヒストグラムを生成する。そして、生成したヒストグラムを所定の関数にフィッティングする。そして、フィッティングした関数のピーク値を求めることによって、最頻値を算出することができる。
 フィッティングに用いる関数としては、ガウス関数またはポアソン関数を挙げることが可能であるが、ガウス関数であることが好ましい。ガウス関数を用いることによって、データ処理速度を速くすることができるという利点が得られる。
 最頻値を算出するための統計分析に用いる標本(パルス)の数は、特に限定されず、例えば500個~1000個である。この程度の数を統計分析に用いれば、統計的に有意な最頻値を算出することができる。このような最頻値は各ヌクレオチドにとって固有の値であるため、この最頻値をヌクレオチドの識別のための指標として使用できる。
 本発明者らは、後述する表1に示すように、参照ヌクレオチドであるdGMP、dAMP、dCMP、dTMP、rGMP、rAMP、rCMPおよびrUMPの最頻値が、各々、87pS、67pS、60pS、39pS、123pS、92pS、64pSおよび50pSであることを実証した。また、参照ヌクレオチドであるメチルシトシン、オキソグアニン、および、リボヌクレオチドまたはデオキシリボヌクレオチドから塩基が脱離したものの最頻値は、各々、105pS、98pS、0pSであった。(なお、これらの最頻値は、0.8nmの電極間距離、0.4Vのバイアス電圧、統計分析のための標本の数(1000個)という条件で算出された。)。このように、最頻値は各参照ヌクレオチドにとって固有の値であるため、この最頻値を、ポリヌクレオチドを構成するヌクレオチドの識別のための指標に使用できる。
 ここで、トンネル電流は、電極間の距離、溶液中のヌクレオチドまたはポリヌクレオチドの濃度、電極の形状、電極間の電圧などの影響を受けるので、トンネル電流から算出される最頻値もこれらの影響を受ける。例えば、同じ種類のヌクレオチドであったとしても、電極間に印加する電圧が0.25V、0.50Vおよび0.75Vのとき、最頻値はそれぞれ異なる。
 このため、上述した最頻値は、分布を有している。したがって、本願発明に用いる参照電流値としては、「1点の最頻値」を用いることも可能であるし、「分布を有する最頻値」を用いることも可能である。参照電流値として「分布を有する最頻値」を用いる場合には、当該「分布を有する最頻値」は、最頻値を求めるために用いた関数(ガウス関数またはポアソン関数)の半値全幅として示すことができる。
 つまり、本発明に用いる参照電流値としては、参照ヌクレオチドの最頻値であってもよいし、参照ヌクレオチドの最頻値をxとし、該参照ヌクレオチドの最頻値を算出するために用いた関数における半値半幅をyとした場合、x±yの範囲の値であってもよい。また、最頻値が上述したように種々の条件の影響を受けるので、参照ヌクレオチドの最頻値は、ポリヌクレオチドの塩基配列を決定するときと同一の条件によって決定されたものであることが好ましい。
 後述する表1にも示すように、参照ヌクレオチドがdGMPである場合、xが87pSであり、yが22pSである。参照ヌクレオチドがdAMPである場合、xが67pSであり、yが17pSである。参照ヌクレオチドがdCMPである場合、xが60pSであり、yが22pSである。参照ヌクレオチドがdTMPである場合、xが39pSであり、yが11pSである。参照ヌクレオチドがrGMPである場合、xが123pSであり、yが54pSである。参照ヌクレオチドがrAMPである場合、xが92pSであり、yが33pSである。参照ヌクレオチドがrCMPである場合、xが64pSであり、yが18pSである。参照ヌクレオチドがrUMPである場合、xが50pSであり、yが12pSである。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が87±22pSの範囲に含まれていれば、当該パルスはdGMPに由来するパルスであると判定することができ、最大電流値が87±22pSの範囲に含まれていなければ、当該パルスはdGMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が67±17pSの範囲に含まれていれば、当該パルスはdAMPに由来するパルスであると判定することができ、最大電流値が67±17pSの範囲に含まれていなければ、当該パルスはdAMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が60±22pSの範囲に含まれていれば、当該パルスはdCMPに由来するパルスであると判定することができ、最大電流値が60±22pSの範囲に含まれていなければ、当該パルスはdCMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が39±11pSの範囲に含まれていれば、当該パルスはdTMPに由来するパルスであると判定することができ、最大電流値が39±11pSの範囲に含まれていなければ、当該パルスはdTMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が123±54pSの範囲に含まれていれば、当該パルスはrGMPに由来するパルスであると判定することができ、最大電流値が123±54pSの範囲に含まれていなければ、当該パルスはrGMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が92±33pSの範囲に含まれていれば、当該パルスはrAMPに由来するパルスであると判定することができ、最大電流値が92±33pSの範囲に含まれていなければ、当該パルスはrAMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が64±18pSの範囲に含まれていれば、当該パルスはrCMPに由来するパルスであると判定することができ、最大電流値が64±18pSの範囲に含まれていなければ、当該パルスはrCMPに由来するパルスではないと判定することができる。
 第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が50±12pSの範囲に含まれていれば、当該パルスはrUMPに由来するパルスであると判定することができ、最大電流値が50±12pSの範囲に含まれていなければ、当該パルスはrUMPに由来するパルスではないと判定することができる。
 また、第2工程にて測定されたパルスの最大電流値が、複数の参照ヌクレオチドの「分布を有する最頻値」に属する場合には、当該パルスを、「分布を有する最頻値」のピークにより近い方の参照ヌクレオチドに由来するパルスであると判定することができる。
 本発明に用いる参照電流値として、上述したように最頻値自体を用いることも可能であるが、当該最頻値をヌクレオチドの中の何れかの最頻値を「1」として求めた比を用いることも可能である。例えば、dGMPおよびrGMPの最頻値の値を「1」とした場合の、他のヌクレオチドの最頻値の比を求め、当該比を参照電流値として用いることも可能である。
 この場合、例えば、上述した参照ヌクレオチドの最頻値の比は、dGMP:dAMP:dCMP:dTMP=1±0.25:0.77±0.20:0.69±0.25:0.45±0.12、および、rGMP:rAMP:rCMP:rTMP=1±0.44:0.75±0.27:0.58±0.16:0.41±0.10となる。
 第3工程では、第2工程にて測定された各パルスの最大電流値が、上述した参照電流値の何れに属するか判定することによって、各パルスを特定のヌクレオチドに対応付ける。そして、当該対応付けに基づいて、第2工程にて測定された各パルスが測定された時間の順番にしたがって、各パルスを特定のヌクレオチドに対応付けた一次塩基配列情報を作成すればよい。
 例えば、第2工程において8つのパルスが検出された場合、上述した判定基準にしたがって、当該パルスを「AGATTCAC」のような一次塩基配列情報に置換することになる。
  〔1-4.第4工程〕
 第4工程は、複数のパルスの中から、パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する工程である。
 本明細書において「パルス持続時間が連続しているパルス」とは、隣接しているパルスのパルス持続時間の間隔が短いこと、換言すれば、連続して出現するパルス、を意図する。
 例えば、任意のパルスのパルス持続時間と、当該パルスに隣接しているパルスの持続時間との間の時間が、1つのヌクレオチドに対応するパルス持続時間よりも短い場合、これらのパルスは、ポリヌクレオチド内で隣接しているヌクレオチドに由来するパルスであると考えて、同じパルス群に分類される。このようにして、第2工程にて検出された複数のパルスを、複数のパルス群へ分類する。そして、一次塩基配列情報の中から、各パルス群に対応する複数の二次塩基配列情報が抽出される。
 なお、1つのパルス群に属するパルスの数は特に限定されず、例えば、2個以上の数であれば幾つであってもよい。1つのパルス群に属するパルスの数が多いほど、後述する第5工程で検索される共通している塩基配列の長さを長くすることができ、その結果、ポリヌクレオチドの塩基配列の決定精度を高めることができる。
 例えば、N個の塩基によって構成されているポリヌクレオチド(例えば、DNAまたはRNA)の塩基配列を決定する場合を考える。N<100の場合には、1つのパルス群に属するパルスの数は、N/3個以上であることが好ましく、N/2個であることが更に好ましく、N個であることが更に好ましく、N個以上であることが更に好ましい。N>100の場合には、1つのパルス群に属するパルスの数は、50個以上であることが好ましく、N/2個であることが更に好ましく、N個であることが更に好ましく、N個以上であることが更に好ましい。
 1つのパルス群に属するパルスの数が50個以上であれば、第5工程および第6工程において、精度の良い操作を可能にする。
 更に具体的には、1つのパルス群に属するパルスの数は、3個以上であることが好ましく、4個以上であることが更に好ましく、5個以上であることが更に好ましく、6個以上であることが更に好ましく、7個以上であることが更に好ましい。1つのパルス群に属するパルスの数は、多いほど好ましい。
 上述した「1つのヌクレオチドに対応するパルス持続時間」は、例えば、参照ヌクレオチドの最大電流値の最頻度を測定するときに、同時に参照ヌクレオチドのパルス持続時間を求めることによって決定することができる。
 例えば、様々な種類の参照ヌクレオチドのパルス持続時間を測定し、これらのパルス持続時間の中の何れかのパルス持続時間(例えば、最も短いパルス持続時間)を、上述した「1つのヌクレオチドに対応するパルス持続時間」と考えることが可能である。
 例えば、実施例に示すように、dGMPのパルス持続時間の最頻値は、略0.8msである(なお、これらの最頻値は、0.8nmの電極間距離、0.4Vのバイアス電圧、統計分析のための標本の数(1000個)という条件で算出された。)。したがって、1つのパルスのパルス持続時間と、当該パルスに隣接しているパルスの持続時間との間の時間が、0.8msよりも短ければ、これらのパルスは、ポリヌクレオチド内で隣接しているヌクレオチドに由来するパルスであると考えることができる。
 また、第4工程では、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出することが好ましい。
 上述したように、1つのヌクレオチドに由来するパルスのパルス持続時間は、約0.8ms~約1msである。それ故に、パルス持続時間が少なくとも1ms以上の時間連続していれば、トンネル電流の測定時のノイズを除去することができるので、より精度良く、ポリヌクレオチドの塩基配列を決定することができる。
 また、パルス持続時間が連続する合計の時間は、長いほど好ましい。例えば、少なくとも2ms以上の時間、少なくとも5ms以上の時間、少なくとも10ms以上の時間、パルス持続時間が連続していることが好ましい。当該構成であれば、ノイズを除去できるのみならず、より長く、ポリヌクレオチドの塩基配列を決定することができる。
 第4工程では、確率統計的な手法(例えば、ガウス関数またはポアソン関数などに基づく確率論)に基づいて二次塩基配列を抽出することが好ましい。換言すれば、第4工程では、確率統計的な手法によって、測定されたトンネル電流に対応し得る複数のヌクレオチドの候補のうちの最も出現確率が高いヌクレオチドによって形成された二次塩基配列情報を抽出することが好ましい。
 図2(c)および(d)にも示すように、各ヌクレオチドに由来するトンネル電流には分布が存在し、各分布は一部が重なっている。それ故に、特定の値のトンネル電流が測定された場合、当該トンネル電流を生じるヌクレオチドの候補が複数存在することになる。しかしながら、各ヌクレオチドに由来するトンネル電流の分布は完全には一致していないので、特定の値のトンネル電流が測定された場合、当該トンネル電流を生じるヌクレオチドの各候補の間では、確からしさ(出現確率)が異なる(例えば、図2(c)および(d)参照)。
 例えば、上述した確率統計的な手法は、測定されたトンネル電流と、当該トンネル電流に関して出現確率が最も高い塩基分子とを対応付ける手法であってもよい。
 一例として、塩基分子が「A」、「T」、「G」または「C」のときを考える。トンネル電流が測定された場合、当該トンネル電流を流す物質が「A」である確率をP(A)、当該トンネル電流を流す物質が「T」である確率をP(T)、当該トンネル電流を流す物質が「G」である確率をP(G)、当該トンネル電流を流す物質が「C」である確率をP(C)とすると、これらの間には以下の関係式が成立する。つまり、
  1=P(A)+P(T)+P(G)+P(C)
 この場合、最も値が高いP(X)(Xは、A、T、GまたはC)と、トンネル電流とを対応付ければよい。つまり、トンネル電流は、塩基分子Xに由来するものであると判定すればよい。
 例えば、特定の値のトンネル電流が測定された場合、P(A)が35%であり、P(G)が50%であり、P(C)が10%であり、P(T)が5%であるとすれば、当該トンネル電流は、最も確率が高いヌクレオチドである「G」に由来すると判定することができる。
 二次塩基配列情報は、連続している複数のパルスからなるパルス群に対応しており、略同じ条件下にて決定された情報であるといえる。そして、連続している複数のパルスを互いに比較しながら、確率統計的な手法に基づいて二次塩基配列を抽出すれば、より正確な二次塩基配列を抽出することができる。
 また、確率統計的な手法に基づいて二次塩基配列を抽出する場合には、電極間の距離が一定に保たれている電極対を用いることが更に好ましい。つまり、上記電極対は、トンネル電流を測定している時に電極間の距離が変化しないものであることが好ましい。
 例えば、電極間の距離の変化率が1%以下であるものが好ましく、0.1%以下であるものが更に好ましく、0.01%以下であるものが更に好ましく、0.001%以下であるものが更に好ましい。
 従来の技術で作製された電極対は、肉眼で観察した場合には一見すると電極間の距離が一定に保たれているように見えるが、実際には電極間の距離が微細に変化している。そして、微細であったとしても電極間の距離が変化すると、トンネル電流の値が一定になり難い。つまり、同じ物質に由来するトンネル電流の値が変化してしまい、ポリヌクレオチドの塩基配列の決定精度が低くなってしまう。
 つまり、従来の技術で作製された電極対では、図2(c)および(d)などに示される分布が容易に変動するので、ヌクレオチドの種類を同定することに困難が伴う。
 一方、電極間の距離が一定に保たれ得る電極対を用いれば、図2(c)および(d)などに示される分布を一定に保つことができるので、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
 つまり、電極間の距離が一定に保たれ得る電極対を用いれば、測定環境に左右されない安定したトンネル電流を測定することができる。そして、その結果、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
 トンネル電流は様々なパラメータによって大きく変動する。例えば、電極間の距離によって大きく変動する。それ故に、一般的な技術者は、トンネル電流に基づいてポリヌクレオチドの塩基配列を決定できるとは考えなかった。一方、実施例に示すように、本発明者らはトンネル電流に基づいてポリヌクレオチドの塩基配列を決定できることを実証した。
 そして、第4工程において確率統計的な手法を用いるとともに、電極間の距離が一定に保たれ得る電極対を用いれば、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
 上記構成を用いない場合には、二次塩基配列の精度にムラが生じ易い。そして、場合によっては二次塩基配列の精度が低くなることもある(例えば、略10%以下)。
 一方、上記構成によれば、トンネル電流をより安定して測定することができるので、確率統計的手法によって抽出される二次塩基配列情報の精度を高めることができる。つまり、より正確な二次塩基配列を抽出することができる。そして、その結果、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列をより正確に決定することができる。具体的には、上記構成であれば、略80%以上の安定した精度で二次塩基配列を抽出することができ、当該精度の高い二次塩基配列に基づいて、ポリヌクレオチドの塩基配列を正確に決定することができる。
 例えば、従来のトンネル電流の計測は、巨大な装置構成である走査型トンネル電子顕微鏡(STM)を用いて行われていたが、STMでは、原理的に、溶液中でのトンネル電流計測は容易ではなく、電極間の距離を一定に保持することは困難である。一方、ピエゾアクチュエータによるフィードバック方式で、微細加工で作製された金属細線を機械的に破断して作製されるナノギャップ電極や、微細加工で作製される基板上のナノギャップ電極は、溶液中でも電極間を一定に保持することが容易である。
  〔1-5.第5工程〕
 第5工程は、複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する工程である。つまり、第5工程は、ポリヌクレオチドの全長の塩基配列情報が断片化された情報である二次塩基配列情報の中から、二次塩基配列情報同士を繋ぎ合わせる箇所を検索する工程である。
 共通している塩基配列の長さは特に限定されず、2塩基長以上の長さであってもよく、3塩基以上の長さであってもよく、4塩基以上の長さであってもよく、5塩基以上の長さであってもよく、10塩基以上の長さであってもよい。ポリヌクレオチドの塩基配列を精度良く決定するためには、共通している塩基配列の長さは、できるだけ長い方が好ましいといえる。
 第5工程にて検索される共通している塩基配列は、できるだけ多くの二次塩基配列情報の間で共通しているものであることが好ましい。例えば、少なくとも2個の二次塩基配列情報の間で共通したものであることが好ましく、少なくとも5個の二次塩基配列情報の間で共通したものであることがより好ましく、少なくとも10個の二次塩基配列情報の間で共通したものであることがより好ましく、少なくとも15個の二次塩基配列情報の間で共通したものであることがより好ましく、少なくとも20個の二次塩基配列情報の間で共通したものであることがより好ましい。上記構成によれば、ポリヌクレオチドの塩基配列をより精度良く決定することができる。
  〔1-6.第6工程〕
 第6工程は、上述した共通している塩基配列を介して、当該共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる工程である。当該工程によって、ポリヌクレオチド(全長または部分長)の塩基配列を決定することができる。
 例えば、第5工程にて、共通している塩基配列を有している二次塩基配列情報として「AGATT」、「GATTC」および「TTCAC」が得られている場合、例えば「AGATT」と「GATTC」とを「GATT」を介して繋ぎ合わせて「AGATTC」を得る。そして、当該「AGATTC」と「TTCAC」とを「TTC」を介して繋ぎ合わせて「AGATTCAC」が得られることになる。
 上記構成によれば、ポリヌクレオチドの塩基配列を、より長く決定することができる。
 第6工程では、第5工程で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、上記三次塩基配列情報同士を繋ぎ合わせてもよい。
 例えば、第5工程にて、共通している塩基配列を有している二次塩基配列情報として「AGATT」、「GATTC」および「TTCAC」が得られている場合、例えば「AGATT」と「GATTC」とに共通している「GATT」と、「GATTC」と「TTCAC」とに共通している「TTC」とが、三次塩基配列情報として抽出される。そして、「GATT」と「TTC」とを「TT」を介して繋ぎ合わせて「GATTC」が得られることになる。
 上記構成によれば、ポリヌクレオチドの塩基配列を、より精度よく決定することができる。つまり、「GATTC」の部分は、複数回、塩基配列の特定がなされた部分であるので、配列の信頼度が非常に高いといえる。
 〔2.ポリヌクレオチドの塩基配列を決定する装置〕
  〔2-1.各構成について〕
 本実施の形態のポリヌクレオチドの塩基配列を決定する装置は、本発明のポリヌクレオチドの塩基配列を決定する方法を実施するための装置である。
 当該装置の構成について、図5を参照しながら説明するが、図5に示す構成は一例であって、本発明はこれに限定されない。なお、〔1.ポリヌクレオチドの塩基配列を決定する方法〕の欄で既に説明した事項については、ここではその説明を省略する。
 本実施の形態の装置100は、電圧印加部10、電極対20、測定部30、一次塩基配列情報作成部40、二次塩基配列情報抽出部50、共通配列検索部60、配列情報連結部70およびデータ格納部80を備えている。以下に、各構成について説明する。
 電圧印加部10は、電極対20に対して電圧を印加するための構成である。
 電圧印加部10によって電極対20に印加する電圧の大きさとしては特に限定されず、例えば、0.25V~0.75Vであり得る。
 電圧印加部10の具体的な構成としては特に限定されず、適宜、公知の電圧印加装置を用いることが可能である。
 電圧印加部10によって電圧が印加されている電極対20の間をポリヌクレオチドが移動し、このときに、電極対20の間にトンネル電流が発生する。そして、本発明では、当該トンネル電流に基づいて、ポリヌクレオチドの塩基配列を決定することになる。
 電極対20の具体的な構成としては、既に詳細に説明したので、ここでは、その説明を省略する。
 測定部30は、ポリヌクレオチドが電極対20の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定するための構成である。測定部30の具体的な構成は特に限定されず、適宜、周知の電流測定装置を用いればよい。
 測定部30によって測定された情報のうち、少なくとも最大電流値に関する情報が、一次塩基配列情報作成部40へ送られる。また、このとき、データ格納部80に蓄積されている参照ヌクレオチドの参照電流値に関する情報も、一次塩基配列情報作成部40へ送られる。
 一次塩基配列情報作成部40では、複数のパルスの最大電流値の間の大小の順番と、参照電流値の間の大小の順番とを比較することによって、測定部30によって検出された複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報が作成される。
 一次塩基配列情報作成部40では、測定部30によって測定された最大電流値に関する情報と、データ格納部80に蓄積されていた参照電流値に関する情報とを比較することによって、測定部30によって検出された複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報が作成されてもよい。
 一次塩基配列情報作成部40およびデータ格納部80の具体的な構成としては特に限定されず、従来公知のコンピュータ等の演算装置およびメモリを用いることが可能である。
 二次塩基配列情報抽出部50は、測定部30から送られる少なくともパルス持続時間に関する情報、一次塩基配列情報作成部40から送られる一次塩基配列情報、および、データ格納部80から送られる参照ヌクレオチドのパルス持続時間に関する情報を受け取る。そして、二次塩基配列情報抽出部50は、これらの情報に基づいて、複数のパルスの中から、パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する。
 なお、二次塩基配列情報抽出部50は、1ms以上の時間の間、パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出するものであってもよい。
 二次塩基配列情報抽出部50の具体的な構成としては特に限定されず、従来公知のコンピュータ等の演算装置を用いることが可能である。
 共通配列検索部60は、二次塩基配列情報抽出部50から複数の二次塩基配列情報を受け取り、当該複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する。
 なお、共通配列検索部60にて検索される共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであってもよい。
 共通配列検索部60の具体的な構成としては特に限定されず、来公知のコンピュータ等の演算装置を用いることが可能である。
 配列情報連結部70は、共通配列検索部60から、共通している塩基配列に関する情報を受け取るとともに、共通している塩基配列を介して、共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる。
 なお、配列情報連結部70は、共通配列検索部60で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、三次塩基配列情報同士を繋ぎ合わせるものであってもよい。
 配列情報連結部70によって繋ぎ合わせられたデータが、検出結果となる。
 配列情報連結部70の具体的な構成としては特に限定されず、来公知のコンピュータ等の演算装置を用いることが可能である。
  〔2-2.装置100の動作のフローの一例〕
 図6に、装置100の動作のフローの一例を示す。なお、当該フローは一例であって、本発明はこれに限定されない。
 S101では、電極対20の間にポリヌクレオチドを含む溶液が充填される。
 S102では、電圧印加部10によって、電極対20に対して電圧が印加される。これによって、電極対20の間に存在するポリヌクレオチドを介して、トンネル電流が流れることになる。
 S103では、測定部30によって、トンネル電流の複数のパルスが検出されるとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とが測定される。
 S104では、上記最大電流値等に基づいて、一次塩基配列情報作成部40にて、一次塩基配列情報が作成される。
 S105では、二次塩基配列情報抽出部50によって、複数の二次塩基配列情報の抽出が行われる。このとき、複数の二次塩基配列情報の抽出ができなかった場合には、S102へ戻る。このとき、複数の二次塩基配列情報の抽出ができた場合には、S106へ進む。
 S106では、共通配列検索部60によって、複数の二次塩基配列情報に共通する塩基配列の検索が行われる。このとき、複数の二次塩基配列情報に共通する塩基配列が検索できなかった場合には、S102へ戻る。このとき、複数の二次塩基配列情報に共通する塩基配列が検索できた場合には、S107へ進む。
 S107では、配列情報連結部70によって、塩基配列情報が連結される。
 上述した実施形態の装置100、装置100に備えられた各構成、および、各ステップは、CPUなどの演算手段が、ROM(Read Only Memory)やRAMなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することが可能である。
 したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読み取り、当該プログラムを実行するだけで、上述した実施形態の装置100、装置100に備えられた各構成、および、各ステップを実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。
 上記記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばROMのようなものがプログラムメディアであってもよいし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであってもよい。
 また、何れの場合でも、格納されているプログラムは、マイクロプロセッサがアクセスして実行される構成であることが好ましい。さらに、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であることが好ましい。なお、このダウンロード用のプログラムは予め本体装置に格納されていることが好ましい。
 また、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD/MO/MD/DVD等のディスクのディスク系、ICカード(メモリカードを含む)等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する記録媒体等があり得る。
 また、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する記録媒体であることが好ましい。
 さらに、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであることが好ましい。
 本発明は、以下のように構成することも可能である。
 本発明のポリヌクレオチドの塩基配列を決定する方法は、上記課題を解決するために、上記ポリヌクレオチドを、電極対の間を通過させる第1工程と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する第2工程と、上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する第3工程と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する第4工程と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する第5工程と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる第6工程と、を有することを特徴としている。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法は、上記第3工程では、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成することが好ましい。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法では、上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることが好ましい。
 上記構成によれば、参照電流値の値を最適化することができるので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法では、上記電極対は金電極であり、上記参照電流値の大小の順番は、上記ヌクレオチドがDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo-dGMP<Methyl dCMPであり、上記ヌクレオチドがRNAである場合には、rUMP<rCMP<rAMP<rGMPであってもよい。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法は、上記第6工程では、上記第5工程で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせることが好ましい。
 上記構成によれば、信頼性がより高い三次塩基配列情報のみを用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法では、上記第5工程にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることが好ましい。
 上記構成によれば、信頼性がより高い共通した塩基配列を用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法は、上記第4工程では、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出することが好ましい。
 上記構成によれば、ノイズを除去することができるとともに、長い二次塩基配列情報を得ることができるので、より効率的にポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する方法では、上記電極対は、電極間の距離が一定に保たれているものであり、上記第4工程では、確率統計的な手法によって上記二次塩基配列情報を抽出することが好ましい。
 上記構成を用いない場合には、二次塩基配列の精度にムラが生じ易い。そして、場合によっては二次塩基配列の精度が低くなることもある(例えば、略10%以下)。
 一方、上記構成によれば、トンネル電流をより安定して測定することができるので、確率統計的手法によって抽出される二次塩基配列情報の精度を高めることができる。つまり、より正確な二次塩基配列を抽出することができる。そして、その結果、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列をより正確に決定することができる。具体的には、上記構成であれば、略80%以上の安定した精度で二次塩基配列を抽出することができ、当該精度の高い二次塩基配列に基づいて、ポリヌクレオチドの塩基配列を正確に決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置は、上記課題を解決するために、ポリヌクレオチドが通過可能な電極間距離を有する電極対と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する測定部と、上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する一次塩基配列情報作成部と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する二次塩基配列情報抽出部と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する共通配列検索部と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる配列情報連結部と、を備えていることを特徴としている。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記一次塩基配列情報作成部は、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成するものであることが好ましい。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることが好ましい。
 上記構成によれば、参照電流値の値を最適化することができるので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記電極対は金電極であり、上記参照電流値の大小の順番は、上記ヌクレオチドがDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo-dGMP<Methyl dCMPであり、上記ヌクレオチドがRNAである場合には、rUMP<rCMP<rAMP<rGMPであってもよい。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記配列情報連結部は、上記共通配列検索部で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせるものであることが好ましい。
 上記構成によれば、信頼性がより高い三次塩基配列情報のみを用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記共通配列検索部にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることが好ましい。
 上記構成によれば、信頼性がより高い共通した塩基配列を用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記二次塩基配列情報抽出部は、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出するものであることが好ましい。
 上記構成によれば、ノイズを除去することができるとともに、長い二次塩基配列情報を得ることができるので、より効率的にポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置では、上記電極対は、電極間の距離が一定に保たれているものであり、上記二次塩基配列情報抽出部は、確率統計的な手法によって上記二次塩基配列情報を抽出するものであることが好ましい。
 上記構成を用いない場合には、二次塩基配列の精度にムラが生じ易い。そして、場合によっては二次塩基配列の精度が低くなることもある(例えば、略10%以下)。
 一方、上記構成によれば、トンネル電流をより安定して測定することができるので、確率統計的手法によって抽出される二次塩基配列情報の精度を高めることができる。つまり、より正確な二次塩基配列を抽出することができる。そして、その結果、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列をより正確に決定することができる。具体的には、上記構成であれば、略80%以上の安定した精度で二次塩基配列を抽出することができ、当該精度の高い二次塩基配列に基づいて、ポリヌクレオチドの塩基配列を正確に決定することができる。
 本発明は、以下のように構成することができる。勿論、以下の構成と、本明細書に記載のあらゆる構成とを組み合わせることが可能である。
 本発明のポリヌクレオチドの塩基配列を決定する方法は、上記課題を解決するために、上記ポリヌクレオチドを、電極対の間を通過させる第1工程と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する第2工程と、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する第3工程と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する第4工程と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する第5工程と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる第6工程と、を有することを特徴としている。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 本発明のポリヌクレオチドの塩基配列を決定する装置は、上記課題を解決するために、ポリヌクレオチドが通過可能な電極間距離を有する電極対と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する測定部と、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する一次塩基配列情報作成部と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する二次塩基配列情報抽出部と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する共通配列検索部と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる配列情報連結部と、を備えていることを特徴としている。
 上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
 <1.電極対の作製>
 図1に示す電極対を、ナノ加工機械的破断接合法(MCBJ)を用いて形成した(Tsutsui, M., Shoji, K., Taniguchi, M., Kawai, T., Formation and self-breaking mechanism of stable atom-sized junctions. Nano Lett. 8, 345-349(2007)参照)。以下に、電極対の作製方法を簡単に説明する。
 ナノスケールの金の接合を、電子線描画装置(日本電子社製、カタログ番号:JSM6500F)を用いて、標準の電子ビームリソグラフィーおよびリフトオフ技術によって、ポリイミド(Industrial Summit Technology社製、カタログ番号:Pyre-Ml)でコーティングされた可撓性の金属基板(リン青銅基板)上にパターン成形した。
 次いで、この接合の下にあるポリイミドを、反応性イオンエッチング装置(サムコ社製、カタログ番号:10NR)を用いて、反応性イオンエッチング法に基づくエッチングによって取り除いた。そして、金属基板を折り曲げることによって、3点にて折り曲げられた構造のナノスケールの金のブリッジを作製した。なお、このような基板の折曲げは、ピエゾアクチュエータ(CEDRAT社製、カタログ番号:APA150M)を用いて行った。
 その後、上記ブリッジを引っ張り、ブリッジの一部を破断させることによって、電極対(金電極)を形成した。具体的には、データ集録ボード(ナショナルインスツルメンツ社製、カタログ番号:NI PCIe-6321)を用いて、レジスタンスフィードバック法によって、プログラミングされた接合の引延し速度の下で、10kΩの直列の抵抗を用いて、0.1VのDCバイアス電圧(Vb)をこのブリッジに印加して、ブリッジを引っ張り、ブリッジを破断させた。そして、ブリッジをさらに引っ張り、破断によって生じたギャップの大きさ(電極間距離)が目的のヌクレオチド分子の長さ(約1nm)になるように設定した。
 このような手順によって、電極対を得た。なお、作製した電極対を顕微鏡観察したところ、電極対の電極間の距離は、0.80nmであった。
 <2.電極対の間に生じるトンネル電流の測定>
 電極対を、ヌクレオチドまたはポリヌクレオチドが溶解したMilli-Q水に浸して、ヌクレオチドまたはポリヌクレオチドが電極対の間に捕捉されたときに生じるトンネル電流を測定した。なお、Milli-Q水におけるヌクレオチドまたはポリヌクレオチドの濃度は、何れも0.10μMであった。
 0.80nmの長さの電極間距離を有する電極対の間を流れるトンネル電流を、0.4VのDCバイアス電圧の下で、10kHzにて、対数増幅器(Rev. Sci. Instrum. 68(10),3816に記載の設計にしたがい、(株)大和技研にて製作)およびPXI 4071 digital multimeter(National Instruments)を用いて測定した。各サンプルについて、200個または個1000個のパルスが検出されるまで測定を行い、これらのパルスについて解析を行った。
 <3.参照ヌクレオチドの最大電流値およびパルス持続時間の測定>
 上記電極対の間を、4種類のデオキシリボヌクレオシド一リン酸(dAMP(2’-deoxyadenosine-5’-monophosphate:Sigma-Aldrich)、dCMP(2’-deoxycytidine-5’-monophosphate sodium salt:Sigma-Aldrich)、dGMP(2’-deoxyguanosine-5’-monophosphate sodium salt hydrate:Sigma-Aldrich)、dTMP(Thymidylic acid disodium salt:Tokyo Chemical Industry Co.(TCI)))および4種類のリボヌクレオシド一リン酸(rAMP(2’-adenosine-5’-monophosphate disodium salt:Oriental yeast)、rCMP(cytidine 5’-monophosphate disodium salt:TCI)、rGMP(Guanosine 5’-monophosphate sodium salt hydrate:TCI)、rUMP(uridine 5’-monophosphate disodium salt hydrate:TCI))の各々を個別に通過させ、このときに電極対の間に生じるトンネル電流を測定するとともに、当該トンネル電流のパルスの最大電流値とパルス持続時間とを測定した。また、別の試料としてメチルシトシン、メチルアデニン、オキソグアニンについても測定した。
 具体的には、Milli-Q水に対して、最終濃度が0.10μMになるように上記デオキシリボヌクレオシド一リン酸またはリボヌクレオチド一リン酸の各々を加えて、測定用溶液を作製した。
 当該測定用溶液を電極の間の空間に充填した状態でナノギャップ電極間に0.4Vの電圧を印加し、このときに電極間に生じるトンネル電流を測定した。なお、このとき、電極の間に存在するデオキシリボヌクレオシド一リン酸またはリボヌクレオシド一リン酸は、ブラウン運動を行っている(測定用溶液の温度は、約25℃であった)。
 図2(a)に、dGMPを含有する測定用溶液を用いたときに、時間の経過とともに測定されるトンネル電流のデータを示す。図2(a)に示すように、時間の経過にともなって、複数のトンネル電流のパルスが観察された。また、トンネル電流の大きさは、約10pA~約100pAであった。
 図2(b)に、図2(a)に示す複数のトンネル電流のパルスの1つを例示する。図2(b)に示すように、各パルスは、Ip(最大電流値)およびtd(パルス持続時間)によって規定することが可能である。例えば、dGMPの典型的なIpおよびtdは、Ip=100pAであり、td=1msであった。
 各デオキシリボヌクレオシド一リン酸および各リボヌクレオシド一リン酸について、約1000個のパルスを用いて、コンダクタンス(Ip/V)ヒストグラムを作製した。なお、当該コンダクタンス(Ip/V)ヒストグラムの作成には、ガウス分布を用いた。
 図2(c)および図2(d)に、コンダクタンス(Ip/V)ヒストグラムを示す。図2(c)および図2(d)に示すように、各核酸モノマーのG値(G値=コンダクタンス(Ip/V)ヒストグラムのピーク値)は、dGMPが87pSであり、dAMPが67pSであり、dCMPが60pSであり、dTMPが39pSであり、rGMPが123pSであり、rAMPが92pSであり、rCMPが64pSであり、rUMPが50pSであった。当該数値の大小を比較すれば、DNAについては、dGMP(87pS)>dAMP(67pS)>dCMP(60pS)>dTMP(39pS)であり、RNAについては、rGMP(123pS)>rAMP(92pS)>rCMP(64pS)>rUMP(50pS)となる。
 上記G値をdGMPまたはrGMPに対して標準化した値を下記表1に示す。
Figure JPOXMLDOC01-appb-T000001
 密度関数理論に基づく計算によれば、占められている最も高い分子軌道エネルギー(HOMO)は、グアニンが-5.7eVであり、アデニンが-5.9eVであり、シトシンが-6.1eVであり、チミンが-6.6eVであり、ウラシルが-6.9eVであった。当該数値の大小を比較すれば、グアニン(-5.7eV)>アデニン(-5.9eV)>シトシン(-6.1eV)>チミン(-6.6eV)>ウラシル(-6.9eV)となる。
 分子軌道エネルギーの大小の順番は、上述した相対的なG値の大小の順番と同じである。このことは、核酸モノマーの種類をトンネル電流に基づいて決定する方法は、エネルギー準位(特に、HOMOエネルギー準位)に基づいて分子の種類を特定し得ることを示している。
 また、上述した「相対的なG値±FWHM」を用いれば、核酸モノマーの種類を特定できることが明らかになった。
 なお、上記表1には示さなかったが、メチルシトシンおよびオキソグアニンの各々のG値は、105pS、98pSであった。
 また、同様の実験条件にて測定した、別の試験結果を表2に示す。
 表1の試験結果と表2の試験結果とは、同様の傾向を示した。
Figure JPOXMLDOC01-appb-T000002
 <4.DNAオリゴマーの核酸配列の決定>
 上述した<3.参照ヌクレオチドの最大電流値およびパルス持続時間の測定>の試験において、核酸モノマーの代わりにDNAオリゴマー(具体的には、TGT、GTG、ATA、CAC、または、GAG)を用いて、同様の試験を行った。
 図3(b)~図3(f)に示すように、TGT、GTG、ATA、CAC、および、GAGの各々について、2種類のコンダタンスレベルが観察された。
 TGT、GTGおよびGAG(各々、図3(b)、(c)、(f)に対応)において、高い方の相対的なG値がdGMP(=1)に対応すると考えた場合、低い方の相対的なG値は、各々、「0.29±0.12」、「0.35±0.12」および「0.68±0.12」となる(下記表3参照)。
 これらの値は、参照ヌクレオチドにおけるdTMPの「相対的なG値±FWHM」(0.45±0.12)、および、参照ヌクレオチドにおけるdAMPの「相対的なG値±FWHM」(0.77±0.20)の範囲内に入るので、0.29±0.12、0.35±0.12および0.68±0.12という得られた値は、各々、dTMP、dTMPおよびdAMPに対応する。
 同様に、ATAおよびCAC(各々、図3(d)、(e)に対応)において、高い方の相対的なG値がdAMP(=0.77)に対応すると考えた場合、低い方のG値は、各々、「0.41±0.07」および「0.52±0.12」となる(下記表3参照)。
 これらの値は、参照ヌクレオチドにおけるdTMPの「相対的なG値±FWHM」(0.45±0.12)、および、参照ヌクレオチドにおけるdCMPの「相対的なG値±FWHM」(0.69±0.25)の範囲内に入るので、0.41および0.52という得られた値は、各々、dTMPおよびdCMPに対応する。
 以上の結果から、DNAオリゴマーを構成するヌクレオチドの種類を、参照ヌクレオチドの「相対的なG値±FWHM」に基づいて決定し得ることが明らかになった。
Figure JPOXMLDOC01-appb-T000003
 <5.パルス持続時間の解析>
 dGMPおよびDNAオリゴマー(具体的には、GGG)についてトンネル電流のパルス(約1000パルス)についてtd(パルス持続時間)を測定するとともに、当該tdの分布を観察した。
 図3(a)に、時間の経過と共に出現する、DNAオリゴマーのトンネル電流のパルスを示す。図3(a)に示すように、DNAオリゴマーは、dGMPと同様に、略同じレベルの相対的なG値を有するパルス群を出願させた。
 図2(e)に、DNAオリゴマーにおけるtdの分布と、dGMPのtdの分布とを示す。図2(e)から明らかなように、DNAオリゴマーのtdのピーク値は、略0.8msであり、dGMPのtdのピーク値も、略0.8msであった。
 このことから、略0.8~略1ms以上のtdを有するトンネル電流のパルスが、実際のヌクレオチドに対応すると考えられる。つまり、当該値よりも短いtdを有するトンネル電流のパルスについては、ノイズ等と考えることができる。
 例えば、GまたはTに対応するトンネル電流のパルスは、1つの台地状のピークを有するパルスとなり、GTまたはTGに対応するトンネル電流のパルスは、2つの台地状のピークを有するパルスとなり、TGTまたはGTGに対応するトンネル電流のパルスは、3つの台地状のピークを有するパルスとなる。つまり、3つの核酸モノマーからなるDNAオリゴマーの電子シグナルを特定しようとすれば、tdの合計が1ms以上、かつ、3つの台地状のピークを有するパルス群であって、各パルスのtdが連続しているものを特定すればよい。
 図3(d)~図3(f)の各々に、自動的に電気シグナルを抽出した結果を示す。これらの図では、3つの台地状のピークを有する明確なパルスが観察されている。
 例えば、DNAオリゴマーのTGTに関するデータを示す図3(g)では、1番目の位置と3番目の位置とに、Tを示す低い台地状のピークを有するとともに、2番目の位置に、Gを示す高い台地状のピークを有するパルスが検出されている。
 また、DNAオリゴマーのGTGに関するデータを示す図3(h)では、1番目の位置と3番目の位置とに、Gを示す高い台地状のピークを有するとともに、2番目の位置にTを示す低い台地状のピークを有するパルスが検出されている。
 つまり、これらのデータは、本発明が、DNAオリゴマーの塩基配列を決定できたことを示している。
 図3(g)および図3(h)に示すように、当該実施例では、「GTG」および「TGT」のみではなく、「G」、「T」、「TG」、「GT」、「GTGTT」および「TGTGT」などの配列も特定されている。これは、DNAオリゴマーが、ブラウン運動を行いながら、確率論的にナノギャップ電極の間に捕捉されているためであると考えられる。例えば、ナノギャップ電極の間において、ブラウン運動による当該TGTオリゴマーの運動の方向が、TGTオリゴマーの3番目のTの位置で反転した場合、「TGTGT」に対応するトンネル電流のパルスが検出されることになる。
 <6.ポリヌクレオチドの塩基配列の決定>
 上述した<5.パルス持続時間の解析>の試験において、DNAオリゴマーの代わりに「5’-UGAGGUA-3’」(以下、miRNAとも呼ぶ)を用いて、同様の試験を行った。
 まず初めに、ランダムに断片化された配列情報を得るために、I-t曲線を作成した。
 図4(a)に示すように、I-t曲線から作成したコンダクタンスヒストグラムは、I=70pS、I=50pS、I=33pSに3つのピークを示した。
 これら3つのピークの相対的なG値は、各々、1、0.71および0.47であって、これらの値は、各々、rGMP、rAMPおよびrUMPに対応する(表4参照)
Figure JPOXMLDOC01-appb-T000004
 上記結果は、miRNA中に3種類の核酸モノマーが含まれていることを示している。
 上述した<5.パルス持続時間の解析>と同様に、miRNAの部分塩基配列を決定した。
 図4(b)~図4(d)に、検出された典型的なシグナルを示す。図4(b)~図4(d)に示すように、「A」、「G」、「U」、「AU」、「UGAGG」および「UGAGGUA」などの部分塩基配列を決定することができた。
 同様にして、133個のシグナルを解析したところ、19個のシグナルが「A」に対応し、15個のシグナルが「G」に対応し、44個のシグナルが「U」に対応し、5個のシグナルが「UA」に対応し、10個のシグナルが「GA」に対応し、5個のシグナルが「UG」に対応し、35個のシグナルが図4(e)に示す配列に対応した。
 図4(e)に示すように、「GAGAGGUA」、「UGAGGAGA」および「UGAGGUAUA」という配列情報も得られた。これらは、ブラウン運動の結果生じた配列情報であると考えられる。
 また、図4(e)に示すように、miRNA中の「AGGUA」および「GAGGUA」が、各々、誤って「AGAUA」および「GAGGUG」として特定されている場合があった。これらは、rGMPの相対的なG値が、rAMPの相対的なG値とオーバーラップしているために生じたと考えられる。
 次いで、図4(e)に示すように、35個の得られた部分塩基配列の重複部分を繋ぎ合わせることによって、miRNAの全塩基配列を決定した。具体的には、頻度高く出現する部分塩基配列を抽出し、当該部分塩基配列を繋ぎ合わせることによって、miRNAの全塩基配列を決定した。
 具体的に、図4(e)に示すように、35個の部分塩基配列のうちの13個の部分塩基配列中(13/35=37%)で「UGA」に対応する部分塩基配列が見出され、35個の部分塩基配列のうちの17個の部分塩基配列中(17/35=49%)で「GAGG」に対応する部分塩基配列が見出され、35個の部分塩基配列のうちの10個の部分塩基配列中(10/35=29%)で「AGGUA」に対応する部分塩基配列が見出され、35個の部分塩基配列のうちの13個の部分塩基配列中(13/35=37%)で「AGGU」に対応する部分塩基配列が見出された。
 そして、「UGA」、「GAGG」、「AGGUA」および「AGGU」を、重複した塩基配列の箇所にて繋ぎ合わせることによって「UGAGGUA」という全塩基配列を決定することに成功した。
 本発明は、以上説示した各構成に限定されるものではなく、特許請求の範囲に示した範囲で種々の変更が可能であり、異なる実施形態や実施例にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態や実施例についても本発明の技術的範囲に含まれる。
 本発明は、1分子のポリヌクレオチドによって生じるトンネル電流を測定することによってポリヌクレオチドの塩基配列の決定を行う装置に利用することができる。また、本発明は、配列が既知であるポリヌクレオチドに生じた変異(例えば、1塩基置換など)を検出する装置(変異検出装置)に利用することができる。
 本発明は、米国立衛生研究所(NIH)が進める次々世代シーケンサーの基本原理であり、PCRによるDNAの増幅およびDNAの化学修飾が不要な次々世代シーケンサーに応用することができる。また、本発明は、インフルエンザウイルスやアレルゲンなどの生体分子を1分子にて検出する高感度センサーへ応用することができる。
  10 電圧印加部
  20 電極対
  30 測定部
  40 一次塩基配列情報作成部
  50 二次塩基配列情報抽出部
  60 共通配列検索部
  70 配列情報連結部
  80 データ格納部
 100 装置

Claims (16)

  1.  ポリヌクレオチドの塩基配列を決定する方法であって、
     上記ポリヌクレオチドを、電極対の間を通過させる第1工程と、
     上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する第2工程と、
     上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する第3工程と、
     上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する第4工程と、
     上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する第5工程と、
     上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる第6工程と、を有することを特徴とする方法。
  2.  上記第3工程では、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成することを特徴とする請求項1に記載の方法。
  3.  上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることを特徴とする請求項1または2に記載の方法。
  4.  上記電極対は金電極であり、
     上記参照電流値の大小の順番は、上記ヌクレオチドがDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo-dGMP<Methyl dCMPであり、上記ヌクレオチドがRNAである場合には、rUMP<rCMP<rAMP<rGMPであることを特徴とする請求項3に記載の方法。
  5.  上記第6工程では、上記第5工程で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせることを特徴とする請求項1~4の何れか1項に記載の方法。
  6.  上記第5工程にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることを特徴とする請求項1~5の何れか1項に記載の方法。
  7.  上記第4工程では、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出することを特徴とする請求項1~6の何れか1項に記載の方法。
  8.  上記電極対は、電極間の距離が一定に保たれているものであり、
     上記第4工程では、確率統計的な手法によって上記二次塩基配列情報を抽出することを特徴とする請求項1~7の何れか1項に記載の方法。
  9.  ポリヌクレオチドが通過可能な電極間距離を有する電極対と、
     上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する測定部と、
     上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する一次塩基配列情報作成部と、
     上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する二次塩基配列情報抽出部と、
     上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する共通配列検索部と、
     上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる配列情報連結部と、を備えていることを特徴とするポリヌクレオチドの塩基配列を決定する装置。
  10.  上記一次塩基配列情報作成部は、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成するものであることを特徴とする請求項9に記載のポリヌクレオチドの塩基配列を決定する装置。
  11.  上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることを特徴とする請求項9または10に記載の装置。
  12.  上記電極対は金電極であり、
     上記参照電流値の大小の順番は、上記ヌクレオチドがDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo-dGMP<Methyl dCMPであり、上記ヌクレオチドがRNAである場合には、rUMP<rCMP<rAMP<rGMPであることを特徴とする請求項11に記載の装置。
  13.  上記配列情報連結部は、上記共通配列検索部で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせるものであることを特徴とする請求項9~12の何れか1項に記載の装置。
  14.  上記共通配列検索部にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることを特徴とする請求項9~13の何れか1項に記載の装置。
  15.  上記二次塩基配列情報抽出部は、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出するものであることを特徴とする請求項9~14の何れか1項に記載の装置。
  16.  上記電極対は、電極間の距離が一定に保たれているものであり、
     上記二次塩基配列情報抽出部は、確率統計的な手法によって上記二次塩基配列情報を抽出するものであることを特徴とする請求項9~15の何れか1項に記載の装置。
PCT/JP2013/059645 2012-03-29 2013-03-29 ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置 Ceased WO2013147208A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020137027253A KR20140138526A (ko) 2012-03-29 2013-03-29 폴리뉴클레오티드의 염기 서열을 결정하는 방법, 및 폴리뉴클레오티드의 염기 서열을 결정하는 장치
CA2833368A CA2833368A1 (en) 2012-03-29 2013-03-29 Polynucleotide base sequence determination method and polynucleotide base sequence determination device
CN201380001067.0A CN103492865B (zh) 2012-03-29 2013-03-29 确定多核苷酸的碱基序列的方法和确定多核苷酸的碱基序列的装置
JP2013541893A JP6343148B2 (ja) 2012-03-29 2013-03-29 ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置
EP13767259.8A EP2833126A4 (en) 2012-03-29 2013-03-29 METHOD FOR DETERMINING A POLYNUCLEOTIDE BASE SEQUENCE AND DEVICE FOR DETERMINING A POLYNUCLEOTIDE BASE SEQUENCE
US14/112,189 US20140055150A1 (en) 2012-03-29 2013-03-29 Polynucleotide base sequence determination method and polynucleotide base sequence determination device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012-077975 2012-03-29
JP2012077975 2012-03-29

Publications (1)

Publication Number Publication Date
WO2013147208A1 true WO2013147208A1 (ja) 2013-10-03

Family

ID=49260449

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/059645 Ceased WO2013147208A1 (ja) 2012-03-29 2013-03-29 ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置

Country Status (7)

Country Link
US (1) US20140055150A1 (ja)
EP (1) EP2833126A4 (ja)
JP (1) JP6343148B2 (ja)
KR (1) KR20140138526A (ja)
CN (1) CN103492865B (ja)
CA (1) CA2833368A1 (ja)
WO (1) WO2013147208A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015170783A1 (en) * 2014-05-08 2015-11-12 Quantum Biosystems Inc. Devices and methods for adjustable nanogap electrodes
WO2015170784A1 (en) * 2014-05-08 2015-11-12 Osaka University Nanogap electrodes with dissimilar materials
US9535033B2 (en) 2012-08-17 2017-01-03 Quantum Biosystems Inc. Sample analysis method
US9644236B2 (en) 2013-09-18 2017-05-09 Quantum Biosystems Inc. Biomolecule sequencing devices, systems and methods
JP2018510329A (ja) * 2015-02-05 2018-04-12 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 流体通路を含むナノポアセンサ
US10202644B2 (en) 2010-03-03 2019-02-12 Quantum Biosystems Inc. Method and device for identifying nucleotide, and method and device for determining nucleotide sequence of polynucleotide
US10261066B2 (en) 2013-10-16 2019-04-16 Quantum Biosystems Inc. Nano-gap electrode pair and method of manufacturing same
US10438811B1 (en) 2014-04-15 2019-10-08 Quantum Biosystems Inc. Methods for forming nano-gap electrodes for use in nanosensors
WO2020218489A1 (ja) * 2019-04-26 2020-10-29 国立大学法人大阪大学 トンネル電流を使用したマイクロrna解析
US12091712B2 (en) 2016-04-27 2024-09-17 Illumina Cambridge, Ltd. Systems and methods for measurement and sequencing of bio-molecules

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2694671B1 (en) 2011-04-04 2021-01-06 President and Fellows of Harvard College Nanopore sensor comprising a device for measuring the local electrical potential
JP6282036B2 (ja) 2012-12-27 2018-02-21 クオンタムバイオシステムズ株式会社 物質の移動速度の制御方法および制御装置
DE102014217014A1 (de) * 2014-08-27 2016-03-03 Siemens Aktiengesellschaft Sequenzierung von Nukleinsäuren mittels Tunnelstrommessungen
CA3000942A1 (en) * 2015-10-08 2017-04-13 Quantum Biosystems Inc. Devices, systems and methods for nucleic acid sequencing
WO2017102852A1 (en) 2015-12-14 2017-06-22 Dubois Valentin Crack structures, tunneling junctions using crack structures and methods of making same
WO2019072743A1 (en) 2017-10-13 2019-04-18 Analog Devices Global Unlimited Company DESIGN AND MANUFACTURE OF SENSORS IN NANOGAP

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011108540A1 (ja) 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6521428B1 (en) * 1999-04-21 2003-02-18 Genome Technologies, Llc Shot-gun sequencing and amplification without cloning
US8232582B2 (en) * 2000-04-24 2012-07-31 Life Technologies Corporation Ultra-fast nucleic acid sequencing device and a method for making and using the same
JP3769465B2 (ja) * 2001-02-13 2006-04-26 独立行政法人科学技術振興機構 新規時計遺伝子Bmal2
US6905586B2 (en) * 2002-01-28 2005-06-14 Ut-Battelle, Llc DNA and RNA sequencing by nanoscale reading through programmable electrophoresis and nanoelectrode-gated tunneling and dielectric detection
US20120254715A1 (en) * 2003-07-10 2012-10-04 David Charles Schwartz Visualizer and editor for single molecule analysis
WO2006070946A1 (en) * 2004-12-28 2006-07-06 Japan Science And Technology Agency A method for analyzing nucleobases on a single molecular basis
WO2007013370A1 (ja) * 2005-07-25 2007-02-01 Shimadzu Corporation 核酸の塩基配列を決定する方法及び装置
GB0625070D0 (en) * 2006-12-15 2007-01-24 Imp Innovations Ltd Characterization of molecules
US9395352B2 (en) * 2007-04-06 2016-07-19 Arizona Board Of Regents On Behalf Of Arizona State University Devices and methods for target molecule characterization
US9034637B2 (en) * 2007-04-25 2015-05-19 Nxp, B.V. Apparatus and method for molecule detection using nanopores
US10839940B2 (en) * 2008-12-24 2020-11-17 New York University Method, computer-accessible medium and systems for score-driven whole-genome shotgun sequence assemble
US8986928B2 (en) * 2009-04-10 2015-03-24 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011108540A1 (ja) 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置

Non-Patent Citations (16)

* Cited by examiner, † Cited by third party
Title
A. J. STORM; J. H. CHEN; X. S. LING; H. W. ZANDBERGEN; C. DEKKER, NATURE MAT., vol. 2, 2003, pages 537
C. DEKKER, NAT. NANOTECHNOL., vol. 2, 2007, pages 209
D. BRANTON; D. W. DEAMER; A. MARZIALI; H. BAYLEY; S. A. BENNER; T. BUTLER; M. DI VENTRA; S. GARAJ; A. HIBBS; X. HUANG, NAT. BIOTECH., vol. 26, 2008, pages 1146
J. LI; D. STEIN; C. MCMULLAN; D. BRANTON; M. J. AZIZ; J. A. GOLOVCHENKO, NATURE, vol. 412, 2001, pages 166
J. M. VAN RUITENBEEK; A. ALVAREZ; 1. PINEYRO; C. GRAHMANN; P. JOYEZ; M. H. DEVORET; D. ESTEVE; C. URBINA, REV. SCI. INSTRUM., vol. 67, 1996, pages 108
M. TSUTSUI; K. SHOJI; M. TANIGUCHI; T. KAWAI, NANO LETT., vol. 8, 2008, pages 345
M. TSUTSUI; M. TANIGUCHI; T. KAWAI, APPL. PHYS. LETT., vol. 93, 2008, pages 163115
M. ZWOLAK; M. DI VENTRA, REV. MOD. PHYS., vol. 80, 2008, pages 141
MASATERU TANIGUCHI ET AL.: "Denryu de Ichi Enki Bunshi o Shikibetsu suru", CHEMISTRY, vol. 66, no. 8, 2011, pages 42 - 46, XP008171818 *
MASATERU TANIGUCHI: "Development of Single- Molecule Bio-Nanodevices for Medical Applications", THE JOURNAL OF IMAGING SOCIETY OF JAPAN, vol. 52, no. 1, 10 February 2013 (2013-02-10), pages 51 - 60, XP008171877 *
MASATERU TANIGUCHI: "Ichibunshi Kaiseki Gijutsu ni yoru Jijisedai DNA Sequencer no Kaihatsu", DAI 69 KAI HYOMEN KAGAKU KENKYUKAI YOSHISHU, 9 March 2011 (2011-03-09), pages 23 - 26, XP008172168 *
MICHAEL ZWOLAK: "Colloquium: Physical approaches to DNA sequencing and detection", REVIEWS OF MODERN PHYSICS, vol. 80, no. 1, 2008, pages 141 - 165, XP002609719 *
NATURE NANOTECHNOLOGY, vol. 5, no. 4, April 2010 (2010-04-01), pages 286 - 290
REV. SCI. INSTRUM., vol. 68, no. 10, pages 3816
See also references of EP2833126A4
TSUTSUI, M.; SHOJI, K.; TANIGUCHI, M.; KAWAI, T.: "Formation and self-breaking mechanism of stable atom-sized junctions", NANO LETT., vol. 8, 2007, pages 345 - 349

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10876159B2 (en) 2010-03-03 2020-12-29 Quantum Biosystems Inc. Method and device for identifying nucleotide, and method and device for determining nucleotide sequence of polynucleotide
US10202644B2 (en) 2010-03-03 2019-02-12 Quantum Biosystems Inc. Method and device for identifying nucleotide, and method and device for determining nucleotide sequence of polynucleotide
US9535033B2 (en) 2012-08-17 2017-01-03 Quantum Biosystems Inc. Sample analysis method
US9644236B2 (en) 2013-09-18 2017-05-09 Quantum Biosystems Inc. Biomolecule sequencing devices, systems and methods
US10557167B2 (en) 2013-09-18 2020-02-11 Quantum Biosystems Inc. Biomolecule sequencing devices, systems and methods
US10261066B2 (en) 2013-10-16 2019-04-16 Quantum Biosystems Inc. Nano-gap electrode pair and method of manufacturing same
US10466228B2 (en) 2013-10-16 2019-11-05 Quantum Biosystems Inc. Nano-gap electrode pair and method of manufacturing same
US10438811B1 (en) 2014-04-15 2019-10-08 Quantum Biosystems Inc. Methods for forming nano-gap electrodes for use in nanosensors
JP2017517009A (ja) * 2014-05-08 2017-06-22 クオンタムバイオシステムズ株式会社 異種材料を含むナノギャップ電極
JP2017517749A (ja) * 2014-05-08 2017-06-29 クオンタムバイオシステムズ株式会社 調節可能なナノギャップ電極用のデバイス及び方法
WO2015170783A1 (en) * 2014-05-08 2015-11-12 Quantum Biosystems Inc. Devices and methods for adjustable nanogap electrodes
WO2015170784A1 (en) * 2014-05-08 2015-11-12 Osaka University Nanogap electrodes with dissimilar materials
JP2018510329A (ja) * 2015-02-05 2018-04-12 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 流体通路を含むナノポアセンサ
US12091712B2 (en) 2016-04-27 2024-09-17 Illumina Cambridge, Ltd. Systems and methods for measurement and sequencing of bio-molecules
WO2020218489A1 (ja) * 2019-04-26 2020-10-29 国立大学法人大阪大学 トンネル電流を使用したマイクロrna解析
JPWO2020218489A1 (ja) * 2019-04-26 2020-10-29
JP7418024B2 (ja) 2019-04-26 2024-01-19 国立大学法人大阪大学 トンネル電流を使用したマイクロrna解析

Also Published As

Publication number Publication date
KR20140138526A (ko) 2014-12-04
US20140055150A1 (en) 2014-02-27
CA2833368A1 (en) 2013-10-03
EP2833126A1 (en) 2015-02-04
JP6343148B2 (ja) 2018-06-13
EP2833126A4 (en) 2015-08-12
CN103492865A (zh) 2014-01-01
CN103492865B (zh) 2018-12-28
JPWO2013147208A1 (ja) 2015-12-14

Similar Documents

Publication Publication Date Title
JP6343148B2 (ja) ポリヌクレオチドの塩基配列を決定する方法、および、ポリヌクレオチドの塩基配列を決定する装置
US10876159B2 (en) Method and device for identifying nucleotide, and method and device for determining nucleotide sequence of polynucleotide
US20250215487A1 (en) Nanopore sequencing
Huang et al. Identifying single bases in a DNA oligomer with electron tunnelling
US8748091B2 (en) Characterizing stretched polynucleotides in a synthetic nanopassage
CN104254771B (zh) 基于纳米孔的分子检测与测序
Timp et al. Nanopore sequencing: electrical measurements of the code of life
US9121823B2 (en) High-resolution analysis devices and related methods
US20070190542A1 (en) Hybridization assisted nanopore sequencing
JP6334115B2 (ja) 生体分子シーケンシング装置、方法、及びプログラム
JP2017532049A (ja) ポリマーの解析
JP2023516167A (ja) 生体高分子の配列を決定する方法
EP4026916B1 (en) Nanopore/nanowell electrode enabled exonuclease sequencing
US9965586B2 (en) Noise reduction methods for nucleic acid and macromolecule sequencing
Mi et al. Ten thousand recaptures of a single DNA molecule in a nanopore and variance reduction of translocation characteristics
JP2016534742A (ja) 量子分子配列決定(qm−seq):ナノエレクトロニクストンネリング分光法を用いたdna、rna、及び単一ヌクレオチド修飾に対する固有指紋の同定
JP2014020838A (ja) ポリヌクレオチド配列決定方法
US20240361297A1 (en) Identifying nucleotides using changes in impedance between electrodes
Renner et al. Sequence-dependent unfolding kinetics of DNA hairpins studied by nanopore forcespectroscopy
JP2014020837A (ja) ポリヌクレオチド配列決定方法
Karau DNA labels for improved detection and capture with solid-state nanopores
Ohshiro et al. Development of a Single Molecular Tunnel-Current Identification method For Electrical Genome Sequencing
Sharma Single Biomolecule Sensing and Characterization Using Solid-State Nanopores
Timp et al. Third Generation DNA Sequencing with a Nanopore
Henley Studying RNA Sequence and Structure Using Solid-State and Hybrid Biomimetic Nanopores

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2013541893

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2833368

Country of ref document: CA

Ref document number: 20137027253

Country of ref document: KR

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2013767259

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 14112189

Country of ref document: US

Ref document number: 2013767259

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13767259

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE