[go: up one dir, main page]

CN108026557A - 使用核酸用于可检索信息储存的方法 - Google Patents

使用核酸用于可检索信息储存的方法 Download PDF

Info

Publication number
CN108026557A
CN108026557A CN201680052866.4A CN201680052866A CN108026557A CN 108026557 A CN108026557 A CN 108026557A CN 201680052866 A CN201680052866 A CN 201680052866A CN 108026557 A CN108026557 A CN 108026557A
Authority
CN
China
Prior art keywords
monomer
bit
sequence
sequences
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680052866.4A
Other languages
English (en)
Inventor
G·M·丘奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard University
Original Assignee
Harvard University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard University filed Critical Harvard University
Publication of CN108026557A publication Critical patent/CN108026557A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0016RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising polymers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J19/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J19/0046Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • G06F5/06Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor
    • G06F5/08Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor having a sequence of storage locations, the intermediate ones not being accessible for either enqueue or dequeue operations, e.g. using a shift register
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B7/00Recording or reproducing by optical means, e.g. recording using a thermal beam of optical radiation by modifying optical properties or the physical structure, reproducing using an optical beam at lower power by sensing optical properties; Record carriers therefor
    • G11B7/24Record carriers characterised by shape, structure or physical properties, or by the selection of the material
    • G11B7/241Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B7/00Recording or reproducing by optical means, e.g. recording using a thermal beam of optical radiation by modifying optical properties or the physical structure, reproducing using an optical beam at lower power by sensing optical properties; Record carriers therefor
    • G11B7/24Record carriers characterised by shape, structure or physical properties, or by the selection of the material
    • G11B7/241Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material
    • G11B7/242Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material of recording layers
    • G11B7/244Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material of recording layers comprising organic materials only
    • G11B7/245Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material of recording layers comprising organic materials only containing a polymeric component
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • B01J2219/00529DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00547Bar codes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00572Chemical means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00596Solid-phase processes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00608DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00675In-situ synthesis on the substrate
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00709Type of synthesis
    • B01J2219/00711Light-directed synthesis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00709Type of synthesis
    • B01J2219/00713Electrochemical synthesis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Human Computer Interaction (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Semiconductor Memories (AREA)

Abstract

本文提供了一种使用如核苷酸的单体储存信息的方法,其包括将一种格式的信息转换成比特流的多个比特序列,其各自具有相应的比特条码,使用每个编码的碱基一个比特将所述多个比特序列转换成多个相应的寡核苷酸序列,在具有多个反应位置的基材上合成多个相应的寡核苷酸序列,并且将合成的多个相应的寡核苷酸序列储存。

Description

使用核酸用于可检索信息储存的方法
技术领域
本发明主要涉及使用单体(如核苷酸)作为二进制比特信息以使用单体(如核苷酸)的序列形成聚合物来编码信息的方法。以这种方式,单体(如核苷酸)的序列可以被用于储存信息,如文本或图像或声音。
背景技术
DNA被认为是信息储存的介质。参见Bancroft等,Science 293,1763-1765(2001)。同样参见,Davis,Art Journal 55,70-74(1996);Gustafsson,Nature 458,703(2009)以及Gibson,Science 329,52-56(2010);US 2003/0228611和WO2014/014991。同样参见US2010/0099080和WO2014/014991。
发明内容
本公开的实施方式是关于使用包括单体的一个或多个聚合物序列作为信息储存介质的方法。本公开的某些实施方式是关于使用包括核苷酸的一个或多个核酸序列作为信息储存介质的方法。信息在自然界中最小、最准确的复制比特——碱基对本身编码。常见核苷酸包括:腺嘌呤(“A”)、胞嘧啶(“C”)、鸟嘌呤(“G”)和胸腺嘧啶(“T”)。根据某些方面,可以使用尿嘧啶(“U”)代替或者补充胸腺嘧啶。也考虑本领域技术人员熟知的其它碱基对,如6碱基的3碱基对和12碱基的6碱基对。还可以使用核酸形成多肽,其编码与本文所述核苷酸类似的信息。
本公开的方面是关于这样的方法,其使用下一代测序和合成技术稳定、大规模读取和写入数字信息。根据一个方面,将文本和/或图像,和/或声音转换成连续的比特,如兆比特。根据一个方面,将文本和/或图像,和/或声音转换成包括比特流的兆比特。然后将兆比特编码成寡聚物,如寡核苷酸。设计如寡核苷酸序列的寡聚物序列,然后将其合成。例如,设计寡核苷酸序列,然后使用酶促寡核苷酸合成反应将其合成,其中将酶和核苷酸在适当的反应条件下置于基材上的所需位点,并且核苷酸共价结合连接支持物的存在的核苷酸。寡核苷酸序列可以使用聚合酶(如易错聚合酶)在这样的条件下合成,所述条件中试剂在一段时间内位于基材的某个位置并且在这样的条件下使得添加单个核苷酸的可能性最大化。考虑到核苷酸添加的反应动力学,也可以在所需时间使用合适的洗涤以将试剂从所述位置去除,从而使得超过一种的核苷酸添加最小化。根据此方面,可以在合适的反应条件下将试剂以液体脉冲添加到基材上的某个位置,并且限定核苷酸能用于添加的时间,例如,在存在聚合酶的情况下。相似地,洗涤也可以液体脉冲添加到某个位置,以将试剂从该位置去除。
根据一个方面,寡聚物(如寡聚核苷酸)包括数据块(data block)序列。根据一个方面,寡聚物(如寡聚核苷酸)包括在比特流中指定数据块位置的地址序列(addresssequence)(如条码序列(barcode sequence))。根据一个方面,寡核苷酸包括位于寡核苷酸各末端用于扩增和测序的侧接共同序列(flanking common sequence)。根据一个方面,寡核苷酸包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列(如条码序列),以及位于寡核苷酸各末端用于扩增和测序的侧接共同序列。
根据本公开的一个方面,每个碱基编码一个比特。根据该方面,可以多种方式编码单个信息,即,A或C对应0、G或T对应数字1。设想了其它组合,如A或G对应0、C或T对应1,或A或T对应0、G或C对应数字1。如本文所讨论考虑了其它组合。根据一个方面,将比特流分成编址的数据块(addressed data block)。根据该方面,建立数据块库,其表示记录的信息。以这种方式,不在需要以其全长表示记录的信息的单个长核酸序列或相对长的核酸序列。
根据一个方面,使用高通量、下一代技术合成、储存并测序各单个寡核苷酸的多个拷贝。因为合成和测序中的错误很少同时发生,所以各分子拷贝在其它拷贝中校正错误。
根据一个方面,使用本领域技术人员已知的方法对寡核苷酸进行测序。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行(即,相同核苷酸或系列中的其它单体的序列)当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。根据某些其它方面,为了在比特流中区分比邻的0或比邻的1,例如,将表示0的两个单体(如核苷酸A和T)在寡核苷酸序列的设计中改变。当在寡核苷酸合成期间可能导致均聚物运行时,这允许将比邻的0或1区分为不同的二进制信息比特。例如,当两个0在比特流中彼此邻近时,即-00-,将对应的核苷酸序列选择为–AT-或–TA-。以这种方法,如果在合成设计的寡核苷酸序列期间导致均聚物运行,如–AAATTT-,那么该均聚物运行将被解释成单个核苷酸并将会被读取成–AT-,对应于-00-。因此,本公开的方法涉及将二进制比特流编码成核酸序列以及将核酸序列解码回二进制比特流,其允许可变核苷酸均聚物运行长度,并能够准确将核酸解码至二进制比特流。
根据一个方面,提供了一种使用核苷酸作为比特的代表来储存信息的方法,其包括将一种格式的信息转换成比特流的多个比特序列,其各自具有相应的比特条码,使用每个编码的碱基一个比特将所述多个比特序列转换成多个相应的寡核苷酸序列,通过脉冲和同步酶试剂和洗剂合成多个相应的寡核苷酸序列,从而使得核苷酸添加至生长的寡核苷酸链,并且将合成的多个相应的寡核苷酸序列储存。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。根据一个方面,可以使用易错聚合酶以合成多个相应的寡核苷酸序列。
根据一个方面,提供了一种从多个合成的寡核苷酸序列检索一种格式的信息的方法,所述合成的寡核苷酸序列编码该格式信息的比特序列,所述方法包括扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列转化成比特序列,并且将比特序列转换成该格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。
根据一个方面,提供了一种由多个合成的寡核苷酸序列访问一种格式的信息的方法,所述合成的寡核苷酸序列编码该格式信息的比特序列,所述方法包括扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列转化成比特序列,将比特序列转换成该格式的信息,并且将该格式的信息可视化,或者将该格式的信息制作成音频。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。
根据一个方面,提供了一种使用核苷酸储存信息的方法,其包括将一种格式的信息转换成比特流,将比特序列编码至相应的寡核苷酸序列,合成寡核苷酸序列,例如,通过使用酶(如易错聚合酶)藉由脉冲和同步试剂和洗剂,从而使得超过一种核苷酸的连接最小化,对寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列解码成比特序列,将比特序列组装成比特流,并且将比特流转换成该格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。
提供了一种使用核苷酸储存信息的方法,其包括将第一格式的信息转换成第一比特流,将第一比特序列编码成相应的寡核苷酸序列,合成寡核苷酸序列,例如,通过使用易错聚合酶藉由脉冲和同步试剂和洗剂,从而使得超过一种核苷酸的连接最小化,对寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列解码成第二比特序列,将第二比特序列组装成第二比特流,并且将第二比特流转换成该第二格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。
本公开的实施方式涉及分子(如核苷酸)作为二进制比特信息的应用。核苷酸可以表示二进制状态,如0或1,而表示二进制状态序列的核苷酸序列(如0或1)可以表示文本、图像、视频或音频格式。以这种方式,使用核酸表示比特,可以将书写材料、图片、具有音频部分的视频或音频记录或任何其他表达介质储存。根据某些方面,例如使用计算机和适当的软件将待储存的信息转换成二进制比特,如根据ASCII编码,其是表示信息的连续的0和1。应当理解的是,可以将待储存的信息转换成本领域已知的信息的其它编码比特。然后确定连续的核苷酸,如通过使用计算机和适当的软件,其表示该连续的信息的编码比特,如0和1。然后在储存介质上合成并储存该连续的核苷酸。当待访问该信息时,确定该连续的核苷酸,然后如通过计算机或适当的软件,将其转换成连续的0和1,然后例如使用计算机和适当的软件将其转换成信息。以这种方式,本公开的方面是关于核酸,无论是完全或部分单链的、双链的或多链的核酸作为信息储存介质的应用。根据一个方面,核酸以顺序或随机的方式被包括在支持基材上。
根据某些方面,聚合酶,包括但不限于易错模板依赖性聚合酶,无论其修饰与否,可以被用于产生具有表示二进制比特的所需核苷酸序列的核苷酸聚合物,所述二进制比特表示待储存的信息。非模板依赖性聚合酶,无论其修饰与否,可以被用于从头开始产生核酸。根据一个方面,使用常见的核苷酸,如A、T/U、C或G。根据一个方面,使用的核苷酸缺少链终止部分。根据一个方面,在形成核苷酸聚合物的方法中不使用链终止核苷酸。根据该方面,可以使用非模板依赖性聚合酶形成核酸序列。这样的非模板依赖性聚合酶可以是易错的,这可能会引起向均聚物中添加超过一种核苷酸。根据本公开的某些方面,出于确定均聚物运行代表何种信息的二进制比特的目的,均聚物运行被解释为单个核苷酸。通过配体活化的传感器(如光敏传感器)、代谢产物或化学物质可与这样的聚合酶使用。
该核酸聚合物可使用本领域技术人员已知的方法进行测序。一旦确定了核酸序列,可以将该核酸序列转换成连续的二进制比特(即,0和1),然后可以将其转换成由该连续的二进制比特所表示的信息。
本公开的某些实施方式的其他特征和优势将在权利要求中以及以下附图和实施方式的说明下更为显而易见。
附图的简要说明
结合附图,通过以下示例性实施方式的详述能够更清楚地理解本发明实施方式的上述和其他特征和其他优点,其中:
图1是描述流过基材的核苷酸脉冲的示意图,所述基材具有将合成寡核苷酸的预定区域。
图2是描述流过基材的核苷酸脉冲的示意图,所述基材具有将合成寡核苷酸的预定区域。
图3是描述流过基材的核苷酸脉冲的示意图,所述基材具有将合成寡核苷酸的预定区域。
某些优选实施方式描述
本发明是关于使用寡聚物储存信息的方法。这样的寡聚体可由单体形成,例如,其可以表示二进制比特。示例性单体包括核苷酸。示例性寡聚体包括寡核苷酸。根据一个方面,提供了编码信息的方法,其中将比特的序列转换成单体(如核苷酸)的序列,其中该单体的序列是聚合物,如寡核苷酸。根据一个方面,本文所述方法可以用于寡核苷酸合成,或者可以使用市售可得或已知的聚合物或核酸合成方法。根据一个方面,使用市售可得或已知的核酸扩增方法。根据一个方面,使用市售可得或已知的核酸测序方法。根据一个方面,使用市售可得或已知的在聚合物中鉴定单体的方法。
根据一个方面,将一种格式的信息的一部分或多个部分,如文本、图像、视频或音频格式,如html格式的信息,如具有文本和/或图像的html书籍的一部分或多个部分转换成比特,即0和1,例如,使用计算机或适当的软件,并且添加比特条码以形成比特序列,即,本领域通常理解的连续的0和1。可以转换成比特的其它格式的信息是本领域技术人员所熟知的。根据一个方面,待转换成比特的html格式的信息的部分可以被称之为字节部分。比特条码可以在整个html格式的信息中确定编码的比特的位置。然后,如通过计算机和适当的软件,使用每个编码的碱基一个比特(A或C=0;T/U或G=1)将比特序列转换成(编码成)设计核苷酸序列,即寡核苷酸或DNA或RNA,以形成对应的编码寡核苷酸序列,即对应或编码比特序列的寡核苷酸序列。
对应部分或整个html格式的信息,产生了多个比特序列。相应地,产生了多个对应的编码寡核苷酸序列,将其合起来可以称为库。该编码寡核苷酸序列的库表示html格式的信息。根据一个方面,寡核苷酸包括比特数据块部分,在比特流中指定数据块位置的比特地址序列,以及用于扩增和测序的侧接共同序列。例如,一个159个核苷酸的寡核苷酸可以包括侧接寡核苷酸的22比特的共同序列(22nt),19比特地址序列(19nt),以及96比特的数据块(96nt)。
根据一个示例性方面,使用易错聚合酶(如非模板依赖性易错聚合酶)和常见或天然核酸(其可能是未被修饰的)合成编码寡核苷酸序列。根据该方面,引发剂序列或引物以已知的(如可寻址阵列中)或随机的各种位置与基材(如二氧化硅基材)连接。将包括至少选定核苷酸、非模板依赖性聚合酶和聚合酶酶活性所需的其它试剂的试剂以一定条件施加在基材的一个或多个位置,所述位置是引发剂序列所在,所述一定条件是聚合酶向引发剂序列添加一个或超过一个或多个核苷酸以延伸引发剂序列。根据一个方面,将核苷酸(“dNTP”)施加于或使其流入已知时间和空间方式或宽度或考虑到聚合酶聚合(或转换速率)速率的周期性应用中。在该示例性方式中,保护基团或可逆终止子并不与dNTP使用,因为选择的反应条件足以限制或减少dNTP的酶促加成(enzymatic addition)至一个dNTP的可能性,即,考虑到反应动力学使用选择的反应条件将一个dNTP添加。尽管如此,应当理解的是,在某些实施方式中,可以使用具有封闭基团或可逆终止子的核苷酸。具有封闭基团或可逆终止子的核苷酸是本领域技术人员已知的。根据另一个实施方式,当反应条件允许时,在常见或天然核苷酸与非模板依赖性易错聚合酶使用时,可以添加超过一个dNTP以形成均聚物运行。然而,在本文所述方法的测序步骤期间,各均聚物运行被解释为表示单个dNTP。以这种方式,本文所述的记录和读取方法允许均聚物运行,并且合成方法不需要仅添加单个dNTP,正如当使用可能容易出现错误的非模板依赖性聚合酶时的情况。
此外,当生产连续的相同二进制比特的核酸时,本公开在表示单个二进制比特的两个不同的单体之间交替。例如,在连续的两个0(“00”)的情况中,对应的核酸用“A”表示第一个0,然后用“C”表示第二个0,这样即使由于易错聚合酶存在A或C的均聚物运行,可以将第一个“0”和第二个“0”以不同的比特彼此区分。应当理解的是,对4个核苷酸,一对核苷酸表示第一个二进制比特,而剩下的一对表示第二个二进制比特。相应地,A和C可以表示第一个二进制比特,而T和G表示第二个二进制比特。或者,A和G可以表示第一个二进制比特,而T和C表示第二个二进制比特。或者,A和T可以表示第一个二进制比特,而C和C表示第二个二进制比特。或者,4个核苷酸可以“三进制”数据系统使用,其中3个核苷酸表示0、1和2,而剩下的核苷酸用作连续的3个核苷酸的下一个,以区分均聚物运行。例如,对4个核苷酸使用三进制数据系统,A、C、T可以分别表示0、1和2,并且G可以用作连续的A、C或T中的下一个,例如,在可能存在均聚物运行时以区分A和连续的A。或者,可以用3个核苷酸表示二进制系统,其中2个核苷酸可以分别代表0和1,并且第三个核苷酸可以用作连续的核苷酸中的下一个,以区分均聚物运行。
可以使用光化学或电化学调节作为反应条件修饰聚合酶活性,从而使得在单个dNTP之外的dNTP添加最小化。然后对一个或多个位置进行洗涤以去除试剂。重复施用试剂和洗涤的步骤直到产生所需的核酸。根据这一个方面,可以将试剂连续地或平行地添加到基材上的一个或超过一个或多个位置,或者可以使试剂与支持物的整个表明接触,如通过将试剂流过支持物的表面。根据一个方面,例如,基于聚合酶的活性或反应动力学确定反应条件,从而限制聚合酶将超过一个核苷酸连接至生长的寡核苷酸或引发剂序列末端的能力。
此外,根据某些实施方式,可以将聚合酶调节成对于基于光的方法光敏性的。根据该方面,调节光以调整聚合酶,使其仅添加单个核苷酸。将该光照射于基材的个别位置或像素,所述位置或像素存在聚合酶、核苷酸和适当的试剂和反应条件。以这种方式,因为聚合酶被光所活化,核苷酸被添加到引发剂序列或存在的核苷酸。
根据某些方面,可以使用易错聚合酶以产生表示信息的寡核苷酸。使用易错过程制备这样的寡核苷酸。易错过程可以包括均聚物运行,即,连续连接两个或多个核苷酸,而不是连接单个核苷酸。根据本公开,当对核酸进行用于转换成二进制比特信息的测序时,均聚物运行被当作均聚物的单个核苷酸。
根据某些实施方式,可以使用模板依赖性易错聚合酶。根据某些实施方式,可以使用模板依赖性易错聚合酶,这可能会容易产生错误。根据某些实施方式,可以使用非模板依赖性RNA聚合酶。
此外,生产核酸序列的有用方法在Sriram Kosuri和George M.Church,NatureMethods,2014年5月,11卷5期,499–507页中的“大规模从头合成DNA:技术与应用(Large-scale de novo DNA synthesis:technologies and applications)”公开,其通过引用全文纳入本文。
在某些方面,来自CustomArray有限公司(CustomArray,Inc.)的市售可得的CustomArray系统是可以被用于通过在基材上影响或改变或产生局部pH来生产编码待储存信息的核酸序列的示例性系统。应当理解的是,可以使用其它方法在基材的特定位置影响或改变或产生pH。CustomArray系统使用pH梯度,并使用基于半导体的电化学合成步骤合成所需的寡核苷酸微阵列。经由铂电极合成各寡核苷酸探针,所述铂电极独立地受控于合成者的电脑。根据本文所述的方法,产生了pH梯度,其在基材特定的所需位置活化pH敏感性聚合酶,以将存在于水性介质中的核苷酸添加到特定的所需位置。根据该方面,调节pH以启动聚合酶,使其仅添加单个核苷酸。根据本文所述的方面,可以使用如CustomArray系统的系统在存在pH依赖性聚合酶、核苷酸和处于水性介质中的其它合适试剂的基材上影响或改变或产生局部pH,以形成寡核苷酸的方法将核苷酸添加到引发剂序列或存在的核苷酸或寡核苷酸。本文所述示例性方法使用水性溶剂和pH以调节如非模板依赖性聚合酶(如TdT)的聚合酶的活性,以形成寡核苷酸的方式将核苷酸添加到位于基材所需位置的引发剂序列、存在的核苷酸或存在的寡核苷酸。
根据一个方面,使用流动池或其它通道(如微流体通道或具有输入和输出的微流体通道)来递送包括试剂(如聚合酶、核苷酸和其它适当的试剂)和洗剂的流体至流动池内基材的特定位置,如反应腔室内。根据某些方面,选择反应条件以使基材上的位置选择性地活化或失活。在这种方式中,所需位置(如基材或阵列上的网格点)可以具有这样的反应条件,其促进核苷酸与引发剂序列、存在的核苷酸、存在的寡核苷酸共价结合,并且该反应条件可以防止其它核苷酸在相同位置上的进一步连接。然后,可以在该所需位置生成寡核苷酸的方法向该相同位置提供促进核苷酸与存在的核苷酸共价结合的反应条件。
根据一个方面,一旦支持物的表面具有了在其上生长的所需核酸,可以将第二基材添加到其上具有核酸的基材表面,并且第二层核酸可以在该第二基材上产生。同样,可以针对其它基材重复该过程,以产生层叠的基材,其具有许多或多个其上具有核酸的基材层。根据该方面,使用位于记录介质各层的寡核苷酸,可以制备储存信息的记录介质。
然后,使用本领域技术人员已知的方法扩增合成的寡核苷酸以形成寡核苷酸的库。然后,使用本领域技术人员已知的方法,如下一代测序方法,对寡核苷酸的库进行测序。然后,将测序的寡核苷酸转换成比特序列,其对应例如html格式的信息。使用本领域技术人员已知的方法,可以将比特序列转换成该格式的信息。使用本领域技术人员已知的方法和装置,可以将该格式的信息可视化或显示或播放(如果是音频格式)。
本文所用的核酸化学、生物化学、遗传学和分子生物学的术语和符号遵循本领域的标准论述和文本中的术语和符合,例如,Kornberg和Baker,DNA Replication(《DNA复制》),第二版(W.H.弗里曼出版社(W.H.Freeman),纽约,1992);Lehninger,Biochemistry(《生物化学》),第二版(沃斯出版社(Worth Publishers),纽约,1975);Strachan和Read,Human Molecular Genetics(《人类分子遗传学》),第二版(WL出版社(Wiley-Liss),纽约,1999);Eckstein编,Oligonucleotides andanalogs:A Practical Approach(《寡核苷酸和类似物:实践方法》)(牛津大学出版社(Oxford University Press),纽约,1991);Gait编,Oligonucleotide Synthesis:A Practical Approach(《寡核苷酸合成:实践方法》)(IRL出版社,牛津,1984);等。
比特
如本文所用术语“比特”应当根据其对本领域技术人员的通用含义予以理解。术语“比特”可以是“二进制数字”的缩写,并且其可以表示计算机和电信中的基础信息容量。“比特”仅表示第一状态或第二状态,如1或0(一或零)。该表示可以通过双态装置的方式在多种系统中实现。
核酸和核苷酸
本文所用术语“核酸分子”、“核酸序列”、“核酸片段”和“寡聚物”可互换使用,并且意在包括但不限于,可能具有各种长度的核苷酸的聚合物形式,包括脱氧核糖核苷酸或核糖核苷酸,或其类似物。
通常,术语“核酸分子”、“核酸序列”、“核酸片段”、“寡核苷酸”和“多核苷酸”可互换使用,并且意在包括但不限于,可能具有各种长度的核苷酸的聚合物形式,包括脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA),或其类似物。寡核苷酸通常由4个核苷酸碱基的特定序列组成,所述4个核苷酸碱基为:腺嘌呤(A);胞嘧啶(C);鸟嘌呤(G);和胸腺嘧啶(T)(当多核苷酸是RNA时,尿嘧啶(U)替代胸腺嘧啶(T))。根据某些方面,可以使用脱氧核苷酸(dNTP,如dATP、dCTP、dGTP、dTTP)。根据某些方面,可以使用核糖核苷酸三磷酸(rNTP)。根据某些方面,可以使用核糖核苷酸二磷酸(rNDP)。
术语“寡核苷酸序列”是多核苷酸分子的字母表示;或者,该术语可以应用于多核苷酸分子本身。可以将该字母表示输入具有中央处理单元的计算机中的数据库中,并用于生物信息学应用,如功能基因组学和同源性搜索。寡核苷酸任选地可以包括一个或多个非标准的核苷酸、核苷酸类似物和/或修饰的核苷酸。本公开考虑了任何脱氧核糖核苷酸或核糖核苷酸和其化学变体,如碱基的甲基化、羟甲基化或糖基化形式等。根据某个方面,在制备核酸的方法中使用天然核苷酸。天然核苷酸缺少链终止部分。根据另一方面,本文所述制备核酸的方法并不使用终止核酸或其它缺少终止核酸的物质,如本领域技术人员已知的可逆终止子。该方法在不存在链终止核酸的情况下进行,或者其中所述核酸不同于链终止核酸。
修饰的核苷酸的示例包括但不限于,二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰基胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿核苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基辫苷(queosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2、2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辫苷、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、五步苷(wybutoxosine)、假尿嘧啶、辫苷、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。还可以在碱基部分(例如,在通常能够与互补核苷酸形成氢键的一个或多个原子和/或在通常不能与互补核苷酸形成氢键的一个或多个原子)、糖部分或磷酸骨架修饰核酸分子。核酸分子可以还包含胺改性的基团,如氨基烯丙基-dUTP(aa-dUTP)和氨基己基丙烯酰胺-dCTP(aha-dCTP),以允许如N-羟基琥珀酰亚胺酯(NHS)的胺反应性部分共价连接。
本公开的寡核苷酸中标准DNA碱基对或RNA碱基对的替代物可以提供每立方毫米更高的密度,更高的安全性(天然毒素的意外或目的性合成的抵抗),光编程的(photo-programmed)聚合酶中更容易的区分,或更低的二级结构。与天然或变异的聚合酶相容、用于从头和/或扩增合成的这样的替代碱基对在Betz K,Malyshev DA,Lavergne T,Welte W,Diederichs K,Dwyer TJ,Ordoukhanian P,Romesberg FE,Marx A(2012)KlenTaq聚合酶通过诱导沃森-克里克几何学复制非天然碱基对(KlenTaq polymerase replicatesunnatural base pairs by inducing a Watson-Crick geometry),Nature Chem.Biol.8:612-614中描述;参见YJ,Malyshev DA,Lavergne T,Ordoukhanian P,Romesberg FE.J AmChem Soc.2011年12月14日;133(49):19878-88,使用高效复制和转录的非天然碱基对类型位点特异性标记DNA和RNA(Site-specific labeling of DNA and RNA using anefficiently replicated and transcribed class of unnatural base pairs);SwitzerCY,Moroney SE,Benner SA.(1993)Biochemistry.32(39):10489-96.异胞苷和异鸟苷之间碱基对的酶促识别(Enzymatic recognition of the base pair between isocytidineand isoguanosine);Yamashige R,Kimoto M,Takezawa Y,Sato A,Mitsui T,Yokoyama S,Hirao I.Nucleic Acids Res.2012Mar;40(6):2793-806.高特异性非天然碱基对系统作为PCR扩增的第三个碱基对(Highly specific unnatural base pair systems as a thirdbase pair for PCR amplification);以及Yang Z,Chen F,Alvarado JB,Benner SA.J AmChem Soc.2011年9月28日;133(38):15105-12,六字母合成遗传系统的扩增、突变和测序(Amplification,mutation,and sequencing of a six-letter synthetic geneticsystem)。可以使用其它非标准的核苷酸,如Malyshev,D.A.,等.,Nature,509卷,385-388页(2014年5月15日)中的dexfribed,通过引用全文纳入本文。
以下6对(A-T、G-C、Z-P、Ds-Px、NAM-SSICS、isoC-isoG)已经被证明与聚合酶相容并且各自之间正交(即,低水平的交叉配对)。
相应地,相对于具有4个碱基系统的2个不同的碱基对,本发明的方面涉及对12个碱基系统使用6个不同的碱基对。相应地,相对于具有4个碱基系统的2个不同的碱基对,本发明的方面涉及对6个碱基系统使用3个不同的碱基对。
根据一个方面,非mRNA依赖性核糖体与本文所述的核苷酸脉冲类似的tRNA脉冲使用,所述核苷酸脉冲使用例如20个标准氨基酸以合成编码信息的聚合物。该方面提供多种类型的单体以及更紧凑的编码,即3X比特/g,由于较小的平均尺寸,以及5/2X比特/g,由于20个标准AA加12个非标准AA(5比特)相较于4个碱基(2比特)更大的多样性。对于该实施方式,每个位置需要更多的脉冲(相较于4个脉冲,20或32个)。
非核苷酸单体
本公开的实施方式包括其它单体分子,这些单体分子可以表示比特,并且可以形成聚合物以记录信息,如本文所述的核苷酸。这样的聚合物及其单体包括这样的单体和生物聚合物,如肽和多肽(如胶原蛋白和万古霉素)、酮化合物(ketide)和聚酮化合物(如脂肪和四环素)、脂肪酸和脂质,脂肪酸和糖脂、糖类和脂多糖、磷脂、激素,多糖(如纤维素和淀粉)、萜烯和聚萜烯(如胆固醇和橡胶)、氨基酸和聚氨基酸(如木质素和多碱性物质)、吡咯和聚吡咯(如血红素和维生素B12)以及酯和聚酯(如PHA,PHV)。其它聚合物包括非生物聚合物,如线性聚合物,包括硅氧烷和聚硅氧烷、丙烯酰胺和聚丙烯酰胺等。这样的寡聚物在纳米孔或其他聚合物测序装置中可以具有足够的热稳定性或易于检测。当使用非核苷酸单体制备聚合物时,使用本领域技术人员已知的方法鉴定这些单体。
根据某些方面,本文鉴定的聚合物(包括基于非核苷酸的聚合物)可以通过将聚合物通过纳米孔或纳米间隙或纳米通道来测序,以确定聚合物中个别单体。简言之,聚合物处于导电介质中,并且在电压差的影响下通过纳米孔。使用离子电流中的界面依赖性变化来区分个别单体。
“纳米孔”指具有纳米级宽度的孔或通道。示例性的纳米孔包括穿过由多聚体蛋白质环形成的膜的孔或通道。一般而言,通道是0.2-25nm宽。本文所用的纳米孔可包括跨膜结构,其可使分子通过膜。纳米孔的示例包括α-溶血素(金黄色葡萄球菌(Staphylococcusaureus))和MspA(耻垢分枝杆菌(Mycobacterium smegmatis))。纳米孔的其他示例可在说明纳米孔测序的领域中发现,或在孔形成毒素领域中描述,如β-PFT Panton-Valentine杀白细胞素S、气单胞菌溶素、和梭菌ε毒素、α-PFT溶细胞素A、二元PFT炭疽毒素、或其他如肺炎链球菌溶血素或短杆菌肽。随着纳米孔测序技术的出现,纳米孔在技术和经济上已经变得重要。纳米孔测序的方法是本领域已知的,例如,如U.S.P.N.5,795,782中所述,其通过引用纳入本文。简言之,纳米孔检测包括将纳米孔-穿孔的膜浸入电压-导电流体中,如包含例如KCl、NaCl、NiCl、LiCl或本领域技术人员已知的其他离子形成无机化合物的离子溶液。跨膜施加电压,并且从通过纳米孔的离子传导产生电流。当纳米孔与聚合物(如DNA或其它非DNA聚合物)相互作用时,以单体特异性方式调节通过纳米孔的流,这导致可以鉴定单体的电流变化。本发明范围内的纳米孔包括本领域技术人员已知的固态非蛋白纳米孔和本领域技术人员已知的DNA折纸纳米孔。这种纳米孔提供了比已知的蛋白质纳米孔更大的纳米孔宽度,其允许较大的分子通过用于检测,同时仍然足够敏感,以检测当复合物通过纳米孔时离子电流的变化。
“纳米孔测序”表示基于聚合物与纳米孔的相互作用确定聚合物组分的方法。纳米孔测序可以通过测量当开口尺寸通过与聚合物的相互作用改变时离子通过纳米孔的导电性变化实现。
除了纳米孔以外,本申请设想使用作为两个电极之间的间隙的本领域已知的纳米间隙,其中间隙的宽度为约几纳米,如约0.2nm至约25nm或约2nm至约5nm。该间隙模拟纳米孔中的开口,并允许聚合物通过两个电极之间的间隙。本公开的方面还设想使用纳米通道电极,将其放置在聚合物通过的纳米通道附近。应理解的是,基于通过电场的分子或部分的运动并产生表示通过电场的结构的电场变形,本领域技术人员将易于设想分子或部分鉴定和测序的不同实施方式。
核酸合成
寡核苷酸可由本文所述的方法使用脱氧核苷酸转移酶(TdT)或易错聚合酶和/或使用本文所述的脉冲/同步法制备。根据某些方面,促进单个核苷酸在所需位置的结合的脉冲或同步参数可以基于基材的尺寸、试剂、浓度、反应温度、和用于产生或递送试剂和洗涤脉冲的结构确定。同步是指核苷酸在酶和其他反应物存在的情况下保留在某个位置的时间,以仅优化单个核苷酸添加,然后进行洗涤,其也可以通过稀释或从所需位置去除反应物或通过在所需位置使试剂失活来影响反应速率。根据某些方面,可以针对TdT的使用优化pH和其它反应物和反应条件,以非模板依赖性方式将dNTP添加到存在的核苷酸或寡核苷酸。例如,通过引用全文纳入本文的Ashley等.,Virology 77,367-375(1977)确定针对dNTP添加的某些试剂和反应条件,如引发剂尺寸、二价阳离子和pH。据报道,TdT在较宽pH范围具有活性,最优pH 6.85。
在某些示例性实施方式中,可以使用一种或多种亚磷酰胺接头,和/或通过本领域技术人员已知的连接方法测序来制备寡核苷酸序列。寡核苷酸序列也可以通过任何合适的方法制备,例如,如本文下述的标准亚磷酰胺方法,以及通过Beaucage和Carruthers((1981)Tetrahedron Lett.22:1859)中所述的那些方法或根据Matteucci等.(1981)J.Am.Chem.Soc.103:3185)的三酯方法,或通过使用本领域已知的商用自动寡核苷酸合成仪或高通量、高密度阵列的其它化学方法(参见,美国专利号5,602,244、5,574,146、5,554,744、5,428,148、5,264,566、5,141,813、5,959,463、4,861,571和4,659,774其在此出于所有目的完整引入以供参考)。也可以从多个供应商购买获得预合成的寡核苷酸。
在某些示例性实施方式中,可以使用本领域抑制的各种微阵列技术制备寡核苷酸序列。预合成的寡核苷酸和/或多核苷酸序列可以连接到支持物或使用下列方法原位合成:光导向方法、流动通道和点样法、喷墨法、销型方法和基于珠的方法,示于下列参考文献中:McGall等,(1996)Proc.Natl.Acad.Sci.U.S.A.93:13555;《基因工程中的合成DNA阵列》(Synthetic DNA Arrays In Genetic Engineering),卷20:111,普莱南出版社(PlenumPress)(1998);Duggan等,(1999)Nat.Genet.S21:10;《微阵列:制作和用于微阵列生物信息学》(Microarrays:Making Them and Using Them In Microarray Bioinformatics),剑桥大学出版社(Cambridge University Press),2003;美国专利申请公开号2003/0068633和2002/0081582;美国专利号6,833,450、6,830,890、6,824,866、6,800,439、6,375,903和5,700,637;和PCT公开号WO 04/031399、WO 04/031351、WO 04/029586、WO 03/100012、WO 03/066212、WO 03/065038、WO 03/064699、WO 03/064027、WO 03/064026、WO 03/046223、WO03/040410和WO 02/24597。
根据某些方面,可以使用下述技术制备寡核苷酸:本领域已知的喷墨技术、本领域已知的电化学技术、本领域已知的微流体技术、本领域已知的光致酸、或本领域已知的光去保护单体(photodeprotected monomer)。这样的技术所具有的优势是,以高速、低成本、较少毒性化学物质制备寡核苷酸,增强可移植性以及将DNA生物化学(例如,修饰、聚合酶、杂交等)与从头(数字或模拟)合成交错的能力。例如,液相化学可与具有空间模式的光使用,其直接来自摄影光学器件或数字微镜显示设备(DMD)。参见US2003/0228611。例如,通过将偶氮苯氨基酸(参见Hoppmann C,Schmieder P,Heinrich N,Beyermann M.(2011)Chembiochem.12(17):2555-9.doi:10.1002/cbic.201100578.Epub 2011年11月13日,可光切换点击氨基酸:构象和生物活性的光控制(Photoswitchable click amino acids:lightcontrol of conformation and bioactivity))纳入聚合酶的活性位点或5’-3’核酸外切酶结构域(如果存在),非模板依赖性聚合酶(像末端脱氧核苷酰转移酶(TdT)或聚(A)聚合酶)或者模板依赖性聚合酶(像Taq或Phi29衍生物)可以具有其通过光编程的基本聚合酶功能、碱基特异性或保真度。
光敏神经元(光遗传学)可以触发离子敏感的聚合酶(参见Zamft B,MarblestoneA,Kording K,Schmidt D,Martin-Alarcon D,Tyo K,Boyden E,Church GM(2012)通过深度测序测量阳离子依赖性DNA聚合酶保真度关系(Measuring Cation Dependent DNAPolymerase Fidelity Landscapes by Deep Sequencing).PLoS One,出版中)或者,对于一些应用而言,粒子流模式自身可以构成储存的数据集。
根据某些方面,可以使用电极阵列、常规相机光学器件、显微镜光学器件、平面光学器件(菲涅耳或珠显微镜头)、弯曲的成像平面在基材上制造核酸。正方形、三角形、六边形或其他重复图案(如在数字摄影中)阵列或模拟成像(如在传统卤化银摄影中)。如果使用光,可以通过DMD(数字微镜装置)、其他数字工程方法或自然(模拟)光场进行空间构图。
根据某些方面,可以通过电化学固相合成制备核酸,如US 6,093,302中所公开,过引用全文纳入本文。根据该方面,使用位于包含至少一个电极的基材上特定位置的单体或核苷酸的电化学配置制备不同聚合物的各种序列或核酸序列,所述至少一个电极优选与缓冲溶液或清除剂溶液接触,以防止由于电化学生成的试剂的扩散所导致的电极间的化学干扰。
根据某些方面,可以使用光致酸合成核酸,如Church等.,Nature,Vol.432,23/2004年12月30日中所述,其通过引用全文纳入本文。
根据某些方面,制备核酸中,提供或递送dNTP、rNTP或rNDP的方法是有用的。JClin Microbiol.1988年5月;26(5):804–807中描述了由dNTP填充的脂质体中pH敏感性病毒颗粒释放脂肪酶或其它膜溶解酶(membrane-lytic enzyme)。可从中释放NTP的光敏笼状(Photo-caged)rNTP或dNTP,特别是对350nm光敏感的硝基苄基衍生物,商购自生命技术公司(Lifetechnologies)视紫红质(rhoposin)或细菌视蛋白触发的信号转导导致囊泡或核苷酸的其他分泌是本领域已知的。藉由这些递送dNTP的方法,核苷酸将在遇到的第一引物聚合酶和任何下游之间被去除或隔离。
根据某些方面,制备核酸中,使用pH或光调节聚合酶活性的方法是有用的。本领域已知具有核苷酸纳入优选pH范围以及发生可逆活性的pH范围的聚合酶。通过合成肽或具有如ACS Nano.2014年5月27日;8(5):4157-65中所述的改变的tRNA的独特遗传编码,可以将偶氮苯氨基酸纳入DNA或RNA聚合酶。其它有用的方法在Nature,500(7463)2013年8月22日中描述。
聚合酶
根据本发明的第一个替代性实施方式,使用聚合酶构建表示信息的核酸分子,所述信息在本文中被记录在核酸序列中,或核酸,在本文中指储存介质。聚合酶是,例如,使用DNA或RNA作为模板产生核酸序列的酶。产生RNA聚合物的聚合酶被称为RNA聚合酶,而产生DNA聚合物的聚合酶被称为DNA聚合酶。包含错误的聚合酶是本领域已知的,并且在本文中称为“易错聚合酶”。非模板依赖性聚合酶可以是易错聚合酶。使用易错聚合酶允许将特定碱基纳入DNA分子的特定位置。易错聚合酶在其试图复制模板时要么接受非标准碱基,如可逆链终止碱基,要么纳入不同核苷酸,如选择性给予的天然的或未修饰的核苷酸。非模板依赖性聚合酶,如末端脱氧核苷酰转移酶(TdT),也被称为DNA核苷酸基内转移酶(DNAnucleotidylexotransferase,DNTT)或末端转移酶,其通过催化核苷酸添加到不具有模板的DNA分子的3'末端制备核酸链。TdT优选的底物是3'-突出,但是其也可以将核苷酸添加到钝的或凹陷的3'末端。钴是一种辅助因子,然而,该酶在体外给予Mg和Mn时催化反应。核酸引发剂可以是4或5个核苷酸或更长的核苷酸,并且可以是单链或双链的。双链引发剂可以具有3’突出,或者其可以是钝端的,或者其可以具有3’凹陷端。
TdT,类似所有DNA聚合酶,同样需要金属离子进行催化。然而,TdT的独特之处在于其使用多种二价阳离子(如Co2+、Mn2+、Zn2+和Mg2+)的能力。通常,引物p(dA)n(其中n是从4到50的链长度)的延伸率与dATP在存在二价金属离子的情况下以如下顺序排列:Mg2+>Zn2+>Co2+>Mn2+。此外,各金属离子对于核苷酸纳入的动力学有不同的效果。例如,Mg2+促进dGTP和dATP的优先应用,而Co2+增加嘧啶、dCTP和dTTP的催化聚合效率。Zn2+作为TdT的独特正效应物,因为用Mg2+的反应速率受到微摩尔量的Zn2+的添加的刺激。该增强可反映Zn2+诱导TdT中构象改变的能力,而其产生较高的催化效率。相较于Mg2+,聚合速率在Mn2+存在的情况下较低,这表明Mn2+并不如Mg2+异样高效地支持反应。TdT的进一步描述在BiochimBiophys Acta.,2010年5月;1804(5):1151–1166中提供,其全部内容通过引用纳入本文。此外,人们可以用其它设计为调节核苷酸结合的阳离子替换核苷酸脉冲中的Mg2+、Zn2+、Co2+或Mn2+。例如,如果核苷酸脉冲用如Na+、K+、Rb+、Be++、Ca++或Sr++的其它阳离子替换Mg++,那么核苷酸可以结合,而不是纳入,因此调节核苷酸是否纳入。然后,可以提供不具有核苷酸或Mg++的预洗涤脉冲(任选),或者然后,可以提供不具有核苷酸的Mg++缓冲液。
通过限制聚合酶可及的核苷酸,可以调节特定核酸到聚合物的纳入。因此,这样的聚合酶能够纳入独立于模板序列的核苷酸,并且因此有益于从头产生核酸序列。易错聚合酶和引物序列的组合作为书写机制,用于将信息给予核酸序列。
通过限制非模板依赖性聚合酶可及的核苷酸,可以调节向引发剂序列或存在的核苷酸或寡核苷酸添加的核苷酸,以通过延伸生成寡核苷酸。因此,这样的聚合酶能够纳入不具有模板序列的核苷酸,并且因此有益于从头产生核酸序列。
η-聚合酶(Matsuda等.(2000)Nature 404(6781):1011-1013)是这样的一种聚合酶的示例,其在所有4种dNTP存在的情况下具有高突变速率(~10%)以及对3’错配较高的耐受,并且如果限制于1中或2种dNTP,这些值可能甚至更高。因此,η-聚合酶是与末端脱氧核苷酸转移酶(TdT)相似的核酸信息的从头记录器(de novo recorder),但是其具有这样的优势,即通过该聚合酶产生的产物是连续双链的。双链DNA比起单链DNA具有较低粘性的二级结构,并且具有更易预测的二级结构。此外,双链DNA作为聚合酶和/或DNA结合蛋白系连(DNA-binding-protein tether)的良好支持物。
根据某些方面,可以使用模板依赖性或模板半依赖性易错聚合酶。根据某些实施方式,可以使用模板依赖性易错聚合酶,这可能会容易产生错误。根据某些实施方式,可以使用非模板依赖性RNA聚合酶。在使用模板依赖性或模板半依赖性聚合酶的情况下,模板与通用碱基的任何组合都可以使用,这将支持接受许多核苷酸类型。此外,可以使用错误耐受阳离子,如Mn+。此外,本公开考虑了使用错误耐受的聚合酶突变体。参见Berger等.,用于杂交、复制和链终止的通用碱基(Universal Bases for Hybridization,Replication andChain Termination),核酸研究(Nucleic Acids Research)2000,8月1日,28(15)pp.2911-2914,其通过引用纳入本文。
根据某些方面,蛋白质、核酸或其它聚合物可以共价地或非共价地结合聚合酶或核酸或其它聚合物,以改变聚合酶向聚合物添加单体能力的方式改变聚合酶和引物的关联。
根据某些方面,DNA或RNA降解酶可被逆转,并且可用于制备核酸。一个示例是制备核糖NTP的多核苷酸磷酸化酶。
根据某些方面,连接酶可用于制备核酸。这样的连接酶包括:本领域技术人员已知的DNA连接酶和本领域技术人员已知的RNA连接酶。DNA连接酶包括细菌和哺乳动物DNA连接酶。示例性连接酶包括:T3连接酶、T4连接酶、T7连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、环状连接酶等。
根据某些方面,可以去除在支持物表面已经合成的核酸,如通过本领域技术人员已知的一种或多种可切割接头。核酸可以位于不同的基材上,如处于比生产密度高的密度,或位于将要作为储存介质的不同的基材上。同样,可以添加其它层的基材,其作为新的基材用于其它核酸合成。相应地,提供了制备高密度核酸储存装置的方法,所述方法通过在第一基材上生成多种寡核苷酸,从第一基材去除多种寡核苷酸,并且将其以随机或顺序的方式与第二基材结合,并且具有所需的密度。
支持物和连接
在某些示例性实施方式中,本文所述的一种或多种寡核苷序列被固定于支持物(例如,固体和/或半固体支持物)。在某些方面,寡核苷酸序列可以使用本文所述的一个或多个亚磷酰胺接头与支持物连接。合适的支持物包括但是不限于,载玻片、珠粒、芯片、颗粒、股线、凝胶、片材、管、球体、容器、毛细管、垫、片、膜、板等。在各种实施方式中,固体支持物可以是生物的、非生物的、有机的、无机的、或其任意组合。本发明的支持物可以是所需的任何形状、尺寸或结构结构。例如,支持物可以是正方形、矩形、圆形、扁平、平面、环形、管状、球形等。当使用基本上是平面的支持物时,可以将支持物物理分隔成区域,例如,用沟槽、凹槽、孔或化学屏障(例如,疏水涂层等)。支持物可以由玻璃(二氧化硅)、金属、陶瓷、聚合物或本领域技术人员已知的其他材料制成。支持物可以是固体、半固体、高弹体或凝胶。在某些示例性实施方式中,支持物是微阵列。本文所用术语“微阵列”在一个实施方式中指一种类型的阵列,其包含固相支持物,所述固相支持物具有基本平的表面,其上有空间确定的非重叠区域或位点的阵列,其各自包含固定的杂交探针。“基本平的”指,位于表面上的感兴趣的特征或物体,例如探针位点,可占据表面上或表面下延伸的一定体积,并且其维度小于所述表面的维度。例如,位于光纤束的面上的珠产生基本平的探针位点表面,或者,位于多孔平面基质或在其上合成的寡核苷酸产生基本平的表面。此外,空间确定的位点可以是“可寻址的”,其中,其位置和该位置处固定的探针的鉴定是已知的或可确定的。
固体支持物还可以包括半固体支持物,如具有固体和液体成分的可压缩的基质,其中,液体占据孔、空间或固体基质元件之间的其它间隙。优选地,半固体支持物包括聚丙烯酰胺、纤维素、聚二甲基硅氧烷、聚酰胺(尼龙)和交联的琼脂糖、右旋糖酐和聚乙二醇。可以共同使用固体支持物和半固体支持物,也可各自独立地使用。
支持物可以还包括固化的介质。根据本发明使用这样固化的介质在核酸分子沉积和扩增所需的条件下是物理稳定且化学惰性。有用的支持基质能够承受PCR所需温度的快速变化和极端温度。支持物材料允许酶促核酸核酸。如果并不知给定的基材是否将会这样,那么在根据发明生产一组阵列的任何尝试之前,对其进行凭经验的测试。根据本发明的一个实施方式,支持物结构包括半固体(即,凝胶状)晶格或基质,其中,晶格或基质元件之间的空隙或孔用水性或其它液体介质填充;典型的孔(或“筛”)尺寸是100μm-5nm的范围内。基质元件之间较大的间隔是在容限范围内,但是在其固定之前,扩增产物扩散的可能性增加。半固体支持物是可压缩的。出于印刷的目的,制备支持物,这样其是平面的,或实际上是平面的。例如,实际上是平面的支持物可能是圆柱形的,这样的话,为了接触其它平面或圆柱形的支持物,通过将一个在另一个上翻转,阵列的核酸分布于其外表面。最后,根据本发明使用的支持物材料允许通过本技术领域已知的方法将阵列的核酸特征与其固定(共价连接)。满足这些条件的物质包括有机和无机物质,并且包括但不限于,聚丙烯酰胺、纤维素、和聚酰胺(尼龙),以及交联的琼脂糖、右旋糖酐和聚乙二醇。
一实施方式是关于玻璃支持物(如板、载玻片或芯片)上的薄聚丙烯酰胺凝胶。如下所述,合成该类型的聚丙烯酰胺片材。丙烯酰胺和双丙烯酰胺以被设计成在单个聚合物链之间产生这样程度的交联的比例(例如,38:2的比例是典型的测序凝胶)混合,当调整用于凝胶中的混合物的整体百分比时,所述程度的交联导致所需孔尺寸,以提供聚丙烯酰胺片材所需的拉伸性能。聚丙烯酰胺凝胶铸造方法是本领域已知的(参见Sambrook等.,1989,《分子克隆,实验室手册》(Molecular Cloning,A Laboratory Manual),第2版,冷泉港实验室出版社,纽约州冷泉港,其通过引用全文纳入本文),并且本领域的技术人员没有困难做出这样的调整。
凝胶片材被浇铸在两个刚性表面之间,其中至少一个表面是在将其与另一个表面去除之后保持连接的玻璃。用不会抑制凝胶聚合的润滑剂涂覆聚合完成后待去除的浇铸表面;出于这样的目的,通常时候用硅烷。将一层硅烷在通风橱下在表面上散布并使其静置直至几乎干燥。然后,用乙醇去除(擦拭,在小物体的情况下,彻底清洗)过量的硅烷。浇铸之前,用常常被称作“交联硅烷”的γ-甲基丙烯酰氧丙基三甲氧基硅烷(目录号M6514,西格玛公司(Sigma);密苏里州圣路易斯)处理将会与凝胶片材结合的玻璃表面。用该试剂涂覆三次将接触凝胶的玻璃表面。面积等于1200cm2的各处理需要在25ml乙醇中的125μl交联硅烷。在该溶液散布到玻璃表面之前,其与750μl水和75μl冰醋酸的混合物结合,并且剧烈摇晃。允许乙醇溶剂在涂层之间蒸发(在通风窗下约5分钟),并且在最后的涂覆干燥后,经由大量乙醇洗涤,尽可能完全地去除过量的交联硅烷,从而防止凝胶上其它支持物平板的“夹心”。然后,将平板组装,并且如所需浇铸凝胶。
决定根据本发明使用的凝胶的尺寸的唯一操作性约束是本领域技术人员浇铸这种凝胶的物理能力。浇铸长达1米的凝胶虽然麻烦,但是对于核酸测序技术熟练的工作人员来说是熟知的方法。如果生产更大的凝胶,根据本发明也是有用的。聚合完成后,由较大完整的凝胶切下极小的凝胶。
注意的是,本领域至少已知一种用于浇铸具有包埋在其基质内的生物活性物质(如酶)的聚丙烯酰胺凝胶的方法(O’Driscoll,1976,Methods Enzymol.,44:169-183,其全部内容通过引用纳入本文)。也已记载使用光交联聚乙二醇树脂并允许在凝胶基质中包埋活细胞的相似的方案(Nojima和Yamada,1987,Methods Enzymol.,136:380-394,其全部内容通过引用纳入本文)。这样的方法根据本发明是有用的。如下所述,出于将完整的染色体DNA递送至适合脉冲场凝胶电泳的基质或作为宿主细胞“菌苔(lawn)”的目的,通常将全细胞浇铸到琼脂糖中,在根据Benton和Davis的方法(参见Maniatis等.,1982,《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),冷泉港实验室出版社(ColdSpring Harbor Laboratory Press),纽约州冷泉港,其全部内容通过引用纳入本文)转移空斑之前,所述菌台将支持噬菌体生长。简言之,电泳级凝胶(例如,超纯;生命技术公司(Life Technologies)/吉布可公司(Gibco)-BRL)溶解于生理(等渗的)缓冲液中,并且允许在管、瓶或烧瓶中平衡至50℃至52℃。然后将细胞加入琼脂糖,并且在将混合物倒出或移液到凝胶电泳槽之前,将其彻底、迅速(如果在瓶或管中,通过旋转盖帽和倒置,如果在烧瓶中,通过涡旋)混合。如果使用低熔点琼脂糖,在添加细胞之前,其可能带来更低的温度(降至接近室温,取决于琼脂糖的浓度)。对于一些细胞类型,这是理想的;然而,如果电泳是在细胞裂解之后、所得核酸池的分子共价连接支持物之前,那么其在冷藏下进行,如在4℃至10℃“冷”室。
固定在微阵列上的寡核苷酸包括在试验反应中或从试验反应产生的核酸。通常,微阵列上的寡核苷酸或多聚核苷酸是单链的,并且共价连接至固相支持物,常常通过5'端或3'端连接。在某些示例性实施方式中,探针经由一个或多个可切割接头固定。微阵列中包含核酸的非重叠区域的密度通常大于100/cm2,并且较为普遍地,大于1000/cm2。有关于核酸探针的微阵列技术的综述见于如下示例性参考文献:Schena,Editor,《微阵列:实践方法》(Microarrays:A Practical Approach)(IRL出版社,牛津,2000);Southern,CurrentOpin.Chem.Biol.,2:404-410(1998);Nature Genetics增刊,21:1-60(1999);和Fodor等,美国专利号5,424,186;5,445,934;和5,744,305。
将寡核苷酸固定于支持物的方法是本领域已知的(珠:Dressman等.(2003)Proc.Natl.Acad.Sci.USA 100:8817、Brenner等.(2000)Nat.Biotech.18:630、Albretsen等.(1990)Anal.Biochem.189:40、和Lang等.Nucleic Acids Res.(1988)16:10861;硝化纤维:Ranki等.(1983)Gene 21:77;纤维素:Goldkorn(1986)Nucleic Acids Res.14:9171;聚苯乙烯:Ruth等.(1987)合成核酸治疗和诊断应用会议(Conference of Therapeutic andDiagnostic Applications of Synthetic Nucleic Acids),英国剑桥.;聚四氟乙烯-丙烯酰胺:Duncan等.(1988)Anal.Biochem.169:104;聚丙烯:Polsky-Cynkin等.(1985)Clin.Chem.31:1438;尼龙:Van Ness等.(1991)Nucleic Acids Res.19:3345;琼脂糖:Polsky-Cynkin等.,Clin.Chem.(1985)31:1438;以及丙烯葡聚糖凝胶:Langdale等.(1985)Gene36:201;乳胶:Wolf等.(1987)Nucleic Acids Res.15:2911)。可用连接化学或聚合物(如,氨基硅烷、NHS酯类、点击化学、多溶素等)涂覆支持物以将核酸结合至支持物。
本文中所用的术语“连接(attach)”指共价相互作用和非共价相互作用。共价相互作用是两个原子或自由基之间由共用一对电子(即,单键)、两对电子(即,双键)或三对电子(即,三键)所形成的化学连接。共价相互作用在本领域中已知为电子对相互作用或电子对键连。非共价相互作用包括但不限于,范德华相互作用、氢键、弱化学键(即,通过短范围非共价力)、疏水相互作用、离子键等。非共价相互作用的综述可见于Alberts等,刊于《细胞分子生物学》(Molecular Biology of the Cell),第三版,加兰出版社(GarlandPublishing),1994。
根据某些方面,使用共价接头将核酸分子附着或固定于基材,所述共价接头选自3-甲基尿苷、丙烯酰基和六乙二醇。除了将接头序列与库的分子连接,所述库用于支持物定向连接,如果需要,限制性位点或调控元件(如启动子元件、帽位点或翻译终止信号)与该库的成员连接。可以设计接头具有化学活性区段,所述区段任选地可以用试剂(如酶)、光、热、pH缓冲液和氧化还原试剂切割。这样的接头可以用于针对各离散的特征预制不同溶液相引物的原位固相非活性储库(reservoir)。一旦切割接头后,引物将会在用于PCR的溶液中释放,也许通过使用来自热循环过程的热作为引发。
还考虑了经由库的成员与共价结合支持物的核酸分子杂交进行核酸分子与支持物的附着。
根据本发明将核酸分子固定于支持物基质通过数个方法中的任一个实现。可以进行经由使用带有适于与支持物共价连接的化学基团的3'-末端标签直接固定,核酸分子库的单链分子与已经结合支持物的寡核苷酸引物的杂交,或将核酸分子散布在支持物上以及导入可以共价连接支持物的引物(在铺板前或后添加)。在使用预固定的引物的情况中,其被设计成捕获广谱的序列基序(例如,给定链长度的几乎所有多聚体,例如,六聚体)、与特异性序列同源的核酸或在特定序列基序上包含变体的核酸。或者,该引物包含与核酸分子库的所有成员共有的合成分子特征,如接头序列。
将会对两种交联核酸分子与聚丙烯酰胺凝胶片材的方法进行详细的描述。第一种方法(由Khrapko等.,1996提供,美国专利号5,552,270)涉及用3-甲基尿苷对核酸分子进行3'加帽。使用该方法制备本发明库的核酸分子,从而在其3'末端包括该修饰的碱基。在引用的方案中,浇铸30μm厚的8%聚丙烯酰胺凝胶(30:1,丙烯酰胺:双丙烯酰胺)片材,然后在室温暴露于50%肼1小时。这样的凝胶根据本发明也是有用的。然后将基质风干至其将吸收包含如下所述核酸分子的溶液的程度。用1mM过碘酸钠(NaIO4)在室温下氧化其3'末端包含3-甲基尿苷的核酸分子10分钟-1小时,用8-10体积的丙酮中的2%LiClO4沉淀并且在水中溶解至10pmol/μl的浓度。调整该浓度,以便在将核酸分子以均匀地覆盖支持物表面并高效地(即完全地)被其吸收的体积散布于支持物时,阵列核酸分子的密度处于上述范围内。将核酸分子散布于凝胶表面,并将平板置于潮湿培养箱4小时。然后将其在室温进行0.5小时的干燥,并在适合其后续使用的缓冲液中洗涤。或者,将凝胶在水中洗涤,重新干燥并储存在–20℃待用。认为结合凝胶的核酸的核酸总体产率是80%,并且对于这些分子,98%通过其氧化的3'基团特异性地连接。
第二种用于将核酸分子共价连接聚丙烯酰胺片材的交联部分是5'丙烯酰基团,其连接到到引物。本发明可以使用在其5'末端包括这样修饰碱基的寡核苷酸引物。具体而言,将这样的寡核苷酸直接浇铸到凝胶中,从而使得丙烯酰基团成为聚合基质的完整、共价结合的部分。引物的3'末端保持未结合,从而使其与库的核酸分子自由地相互作用并杂交,以及开始其酶促第二链合成。
或者,使用六乙二醇将核酸分子与尼龙或其它支持物基质共价连接(Adams和Kron,1994,美国专利号5,641,658)。此外,核酸分子经由用紫外光的辐射与尼龙交联。尽管由于波长和透射强度的变化,需要对各种使用仪器校准辐射支持物的时间长度以紫外光源的最佳距离,但是至少一种针对核酸分子与杂角膜交联专门设计的装置可市售获得(Stratalinker,斯查塔基公司(Stratagene))。应注意,在经由放射进行交联的过程中,将会出现受限的核酸链切口。然而,在诸如杂交过程中所用的条件下,切口的量通常是可忽略的。然而,在一些情况中,核酸分子紫外光交联的方法将由于切口并不适用。核酸分子与支持物在既非5'-末端或3'-末端的附着也同样发生,但应注意的是,如此交联的阵列的潜在应用很大程度上并不受到影响,因为这样的交联并不抑制寡核苷酸引物与结合支持物的固定的分子的杂交。
试剂递送系统
根据某些方面,试剂和洗剂以脉冲的形式递送,从而使反应物在所需位置存在所需的一段时间,例如,以将dNTP共价连接至在所需位置连接的存在的核苷酸或引发剂序列。将选定核苷酸试剂液体脉冲过或流过阵列,然后使用不包括该核苷酸的洗剂或缓冲液的脉冲。例如,通过反应动力学是否是酶促的或是其它的方式,确定脉冲的持续时间。核苷酸和洗剂之间的脉冲持续时间可以不同,或者其可以是相同的。例如,0.2秒脉冲对于递送试剂和递送洗剂都是有效的。根据某些方面,试剂递送和洗剂递送的时间相对于反应核苷酸的接触以及反应的动力学同步。
例如,参考图1、图2和图3,提供了具有示例性反应位置的基材,所述位置通过圆圈表示。反应位置可以是随机的,或者可以是预先确定的区域,如有序阵列。可以封闭基材的表面以形成反应区域或流动池,反应物可以从其中流过,或者可以将基材置于反应物可以从其中流过的流动池中。反应区域有入口和出口,因此可以添加反应物,并且与基材的表面接触以及去除。设想了多种流动池实施方式或流动通道实施方式或微流体通道实施方式,这些实施方式可以使用泵或电极或其它移动流体通过通道或微流体通道领域技术人员已知的方法,通过一个或多个通道递送单独的试剂或试剂的混合物或洗剂至基材表面所处位置的反应区域或容器,从而使得试剂可以接触待添加核苷酸的所需位置。所需位置可以还包括电极或其它装置,用于生成pH或递送某一体积特定pH的流体,所述特定pH将由于将核苷酸添加到所需位置使酶被活化或失活或调节。
如图1所示,包括核苷酸A的试剂的第一脉冲流过基材表面。将核苷酸A添加到一个或多个基材上所需位置,在该位置中,反应条件足以实现核苷酸A至引发剂序列或存在的核苷酸或寡核苷酸的酶促添加。添加核苷酸A后,可将洗剂流过基材的表面以去除核苷酸A。然后将包括核苷酸T的试剂的第二脉冲流过基材的表面。将核苷酸T添加到一个或多个基材上所需位置,在该位置中,反应条件足以实现核苷酸T至引发剂序列或存在的核苷酸或寡核苷酸的酶促添加。添加核苷酸T后,可将洗剂流过基材的表面以去除核苷酸T。然后将包括核苷酸G的试剂的第三脉冲流过基材的表面。将核苷酸G添加到一个或多个基材上所需位置,在该位置中,反应条件足以实现核苷酸G至引发剂序列或存在的核苷酸或寡核苷酸的酶促添加。添加核苷酸G后,可将洗剂流过基材的表面以去除核苷酸G。图2显示了包括核苷酸C的试剂的第四脉冲和包括核苷酸A的试剂的第五脉冲。图3显示了流过基材表面并离开反应区域的脉冲。根据一个示例性方面,调节所需位置的pH,从而调节所需位置pH敏感酶的活性,以将试剂流体中的核苷酸酶促地添加到所需位置。根据一个示例性方面,调节所需位置的光,从而调节所需位置光敏感酶的活性,以将试剂流体中的核苷酸酶促地添加到所需位置。通过激活刺激来活化酶的其它方法是本领域技术人员已知的,并且可以用于本文以将试剂流体中的核苷酸酶促地添加到所需位置。
根据一个方面,提供了这样的装置,其允许对体积小于100纳升的许多小液体库进行多重处理。本领域已知用于分析液体样品的系统,所述系统包括具有两个平行平面的压板以及具有这样尺寸的通孔,所述尺寸通过表面张力将液体样品维持于各通孔中(EP1051259A1,2012年11月15日,其全部内容通过引用纳入本文)。使用毛细管作用可以将样品从平面吸出,并且可以进行稀释和混合。各通孔可以通过光学辐射进行研究。可以根据本文所述方法使用该装置,以及类似装置,如Gene Logic公司的Flow-Thru ChipTM(Torres等.,WO 01/45843 A2,2001年6月28日,其全部内容通过引用纳入本文)。各腔室的内壁可用5'-连接的模板核酸序列功能化,并且所有其它必要试剂(如位点特异性重组酶或易错聚合酶和核苷酸)以液相递送至各离散的腔室(或“蜂窝”孔道)。
在某些实施方式中,可以这样分离基材(如显微镜载玻片):1)如果相同的分析物核酸分子库旨在均匀地铺展载玻片的所有特征,通过可润湿的表面边界区域,或者2)如果各特征将由不同的分析物核酸分子和/或引物库点样,通过非润湿的表面边界区域。上述的组合也同样可能,如被再分成较大的连续可润湿区域组的载玻片,各自通过非润湿边界结合,其中,各可润湿区域被进一步分成较小的特征,各自包括不同的点样引物(spottedprimer)。
根据另一个实施方式,其还可能通过这样区分单个DNA分子:将具有通过连续疏水性边界分隔的非连续亲水性特征的载玻片浸入稀释的DNA模板分子的水溶液中。由于将载玻片去除并在其侧面温和地进行印迹,将会在亲水性特征上形成小液珠,从而产生包括0个、1个或>=2个DNA模板的小型非连续液体库(参见Brennan,美国专利号No.6,210,894B1,2001年4月3日,其全部内容通过引用纳入本文,用于描述相关领域)。
根据另一个实施方式,提供了具有一个或多个储库的微流体装置,所述储库包括将经由微通道转移至反应区的一种或多种试剂,所述反应区是试剂混合和反应发生的位置。本领域技术人员已知这些微流体装置以及移动流体试剂流过这些微流体装置的方法。
如果需要,固定的核酸分子可以使用这样的装置(例如,任何市售可得的可以基本无修饰形式使用的喷墨打印机),这样的装置将喷射集中爆发的包含试剂的溶液(参见Castellino(1997)Genome Res.7:943-976,其全部内容通过引用纳入本)。.当前,这样的方法在Incyte制药公司和Rosetta生物系统有限公司进行,后者采用“轻微修饰的爱普生墨盒”(加利福尼亚州托伦斯的爱普生美国有限公司(Epson America,Inc.))。喷墨沉淀的方法依赖于压电效应,以此包含感兴趣液体的窄管(在这种情况下是寡核苷酸合成试剂)被适配器包围。穿过适配器的电荷导致适配器以不同于管的速率膨胀,并且迫使小滴液体试剂从管中移到涂覆的载玻片或其他支撑物。
试剂可以在支持物的离散区域沉淀,因此各区域形成阵列的特征。所需核酸序列可以作为一个整体沉淀或者在各位置逐滴合成,因为对于本领域已知的其他方法也是如此。如果试剂的色散角很窄,其可以创建包含许多特征的阵列。或者,如果喷雾装置更广泛地聚焦,那么其将以更宽的角度分散核酸合成试剂(几乎是每次覆盖整个支持物)并且产生各成员具有相同序列的阵列(即,该阵列只有单一功能)。
根据某些方面,针对结合核苷酸前体(dNTP/rNTP/rNDP)的时间和用生长的引物3’末端制造共价键所花费时间考虑不同分布。如果前体脉冲保持较短,那么可以结合,并且在等待共价键形成反应的同时,持续的试剂流可以在无核苷酸缓冲液中扫过。第一结合反应是核苷酸浓度依赖性的。如果X核苷酸的平均长度是目标,那么可预期的分布将是泊松分布的(Poisson-distributed),并且对X=1个核苷酸平均值的理论最大值将会是37%产率,其余为纳入的0、2、3…个核苷酸。相反,接近本文所述的脉冲针对X=1可以产生大于37%的产率。
根据某些方面,使用了基于阵列的流式细胞技术,这与标准合成和测序过程相似。起始TdT引物与平面二氧化硅(或10微米厚聚合物层)在已知位置结合。dNTP将以调整为TdT聚合(或转换)速率的已知时间和空间宽度的周期性波形流动。TdT活性受光化学或电化学调节,如通过改变所需位置的pH值。产生寡核苷酸的位置数量可以在90,000和5,000,000之间的范围。
用于在已知位置产生酸或碱以调节pH(如在高或低pH之间)的示例性方法包括至少一个电极,优选与缓冲溶液或清除溶液接触以防止由于电化学产生试剂扩散引起的电极之间的化学干扰。参照通过引用纳入本文的US 6,093,302。或者,可以使用光致酸在所需位置调节pH。参见Tian等.,Nature,432卷,2004年12月23/30,1050-1054页,其通过引用纳入本文。
使用pH或光调节聚合酶活性或dNTP/rNTP/rNDP途径的方法可以通过这样实现:(1)由(dNTP填充的)脂质体中pH敏感性病毒颗粒释放脂肪酶(或其他膜溶解酶)(参见J.Clinical Microbiology 1988年5月:26(5)804-807)以及J.Control Release 2013年11月28日;172(1):341-50;(2)光敏笼状rNTP或dNTP,如350nm光有效的硝基苄基衍生物;(3)视紫红质或细菌视蛋白触发的信号转导导致囊泡或核苷酸的其他分泌;(4)具有纳入优选pH范围以及发生可逆活性的pH范围的聚合酶;(5)纳入DNA或RNA聚合酶的偶氮苯氨基酸(经由具有改变的tRNA的合成肽或新遗传编码)(参见ACS Nano 2014年5月27日;8(5):4157-65)以及(6)Konerman等.,Nature(2013),哺乳动物内源性转录的光学控制(OpticalControl of mammalian Endogenous Transcription)中所述方法。根据一个方面,所述使用方法(1)-(3)释放核苷酸需要这样的方法,其去除或隔离第一引物聚合酶接触和任何下游之间释放的核苷酸。聚合酶调节方法(4)-(6)并不需要这样的作用。
根据某些方面,包括了RNA聚合酶或DNA或RNA降解酶的逆转物,例如针对核糖NTP的多核苷酸磷酸化酶(PNP),连接酶,如RNA连接酶、环状连接酶。除了非模板依赖性聚合酶,还包括半依赖性聚合酶(又称易错聚合酶或旁路聚合酶(bypass polymerases))。蛋白质、核酸或其它聚合物环可以共价或非共价连接聚合酶,并且围绕核酸或其他聚合物(polymertrack)踪迹,使得这样聚合酶与引物的连接更有效。
扩增
通常,“扩增”包括经由重复轮启动的酶促合成生成核酸分子的拷贝。“原位”扩增指该扩增发生在位于支持物或珠上而不是溶液中的模板核酸分子。原位扩增方法描述于美国专利号6,432,360。存在具有不同性质,如温度、链置换和校正能力的多种聚合酶选择。扩增可以是等温的并且以诸如多重置换扩增(MDA)相似的适应型,所述MDA述于Dean等.,使用多重置换扩增的全基因组扩增(Comprehensive human genome amplification usingmultiple displacement amplification),Proc.Natl.Acad.Sci.U.S.A.,99卷,5261-5266页.2002;以及Dean等.,使用phi29DNA聚合酶的质粒和噬菌体DNA快速扩增和多重启动滚环扩增(Rapid amplification of plasmid and phage DNA using phi29DNA polymeraseand multiply-primed rolling circle amplification),Genome Res.,11卷,1095-1099.2001;以及Aviel-Ronen等.,用于DNA福尔马林固定石蜡包埋组织的全基因组扩增的大片段Bst DNA聚合酶(Large fragment Bst DNA polymerase for whole genomeamplification of DNA formalin-fixed paraffin-embedded tissues),BMC Genomics,7卷,312页.2006。扩增还可以通过不同温度方法进行循环,如Mullis等.体内DNA特异性酶促扩增:聚合酶链反应(Specific enzymatic amplification of DNA in vitro:Thepolymerase chain reaction).Cold Spring Harbor Symp.Quant.Biol.,51卷,263-273页.1986中所述的传统聚合酶链反应(PCR)。Zhang等.,由单细胞进行全基因组扩增:对基因分析的影响(Whole genome amplification from a single cell:implications forgenetic analysis),Proc.Natl.Acad.Sci.U.S.A.,89等,5847-5851等.1992.以及Telenius等.,简并寡核苷酸引物PCR:通过单个简并引物对目标DNA的一般扩增(Degenerate oligonucleotide-primed PCR:general amplification of target DNA bya single degenerate primer),Genomics,vol.13,p.718-725.1992.中描述了更加适合基因组扩增的变形。其它方法包括:普罗尼PCR(polony PCR),述于Mitra和Church,许多个体DNA分子的原位局部扩增和接触复制(In situ localized amplification and contactreplication of many individual DNA molecules),Nuc.Acid.Res.,27卷,e34页.1999;乳液PCR(ePCR),述于Shendure等.,进化细菌基因组的准确多重普罗尼测序(Accuratemultiplex polony sequencing of an evolved bacterial genome),Science,309卷,1728-32页.2005;以及Williams等.,通过乳液PCR扩增复杂基因文库(Amplification ofcomplex gene libraries by emulsion PCR),Nat.Methods,3卷,545-550页.2006。任何扩增方法可与反转录步骤(先用)组合以允许扩增RNA。根据某些方面,并不绝对需要扩增,因为可以使用具有足够灵敏度的探针、报告物和检测系统来允许使用所述模板非杂交核酸结构检测单个分子。适应系统灵敏度的方法包括选择激发源(例如,照明)和检测(例如,光电探测器、光电倍增管)。适应信号水平的方法包括允许堆叠报告物的探针,并且还可以使用高强度报告物(例如,量子点)。
用于本公开的扩增方法可包括,将核酸分子和与核酸分子特异性杂交的一种或多种引物在促进杂交和链延伸的条件下接触。用于扩增核酸的示例性方法包括聚合酶链式反应(PCR)(参见例如,Mullis等(1986)Cold Spring Harb.Symp.Quant.Biol.51Pt 1:263和Cleary等(2004)Nature Methods 1:241;和美国专利号4,683,195和4,683,202),锚PCR、RACE PCR、连接链式反应(LCR)(参见例如,Landegran等(1988)Science 241:1077-1080;和Nakazawa等(1994)Proc.Natl.Acad.Sci.U.S.A.91:360-364)、自维持序列复制(Guatelli等(1990)Proc.Natl.Acad.Sci.U.S.A.87:1874)、转录扩增系统(Kwoh等(1989)Proc.Natl.Acad.Sci.U.S.A.86:1173)、Q-β复制酶(Lizardi等(1988)BioTechnology 6:1197)、循环PCR(Jaffe等(2000)J.Biol.Chem.275:2619;和Williams等(2002)J.Biol.Chem.277:7790),美国专利号6,391,544、6,365,375、6,294,323、6,261,797、6,124,090和5,612,199所述的扩增方法、等温扩增(例如,滚环扩增(RCA)、超支化的滚环扩增(HRCA)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、PWGA)或采用本领域技术人员熟知的技术的任何其它核酸扩增方法。
在示例性实施方式中,本文公开的方法利用PCR扩增。“聚合酶链反应”或“PCR”表示通过DNA互补链的同时引物延伸而在体外扩增特定DNA序列的反应。换言之,PCR是用于产生侧接有引物结合位点的靶标核酸的多重拷贝或复制物的反应,所述反应包括如下步骤的一个或多个重复:(i)使靶核酸变性,(ii)使引物与引物结合位点退火,和(iii)在三磷酸核苷存在下由核酸聚合酶延伸引物。通常,在热循环仪设备中,通过为各个步骤优化的不同温度循环进行该反应。具体温度、每步持续时间和步骤之间的改变速率取决于本领域普通技术人员熟知的众多因素,例如下述参考文献所述:McPherson等编,PCR:A PracticalApproach(《PCR:实践方法》)和PCR2:A Practical Approach(《PCR2:实践方法》)(IRL出版社,牛津,分别出版于1991和1995年)。例如,在采用Taq DNA聚合酶的常规PCR中,双链靶标核酸可在高于90℃的温度下变性,引物在50-75℃的温度范围内退火,并且引物在68-78℃的温度范围内延伸。
术语“PCR”涵盖所述反应的衍化形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、装配PCR等。反应体积范围从数百纳升,例如,200nL,到数百微升,例如,200μL。“逆转录PCR”或“RT-PCR”指PCR前先用逆转录反应将靶RNA转化成互补单链DNA,然后扩增该DNA,例如Tecott等,美国专利5,168,038。“实时PCR”指在反应进行的同时监测反应产物即扩增子含量的PCR。实时PCR有多种形式,它们的区别主要是用于监测反应产物的检测化学,例如Gelfand等,美国专利号5,210,015(“TAQMANTM”);Wittwer等,美国专利号6,174,670和6,569,627(插入染料);Tyagi等,美国专利号5,925,517(分子信标)。实时PCR所用检测化学的综述可参见Mackay等,Nucleic Acids Research,30:1292-1305(2002)。“巢式PCR”指两阶段PCR,其中第一阶段PCR的扩增子成为利用新一组引物进行第二阶段PCR的样品,新引物中至少一个引物结合第一扩增子的内部位置。提到巢式扩增反应时,本文所用的“初始引物”指用于产生第一扩增子的引物,“二级引物”指用于产生第二扩增子或巢式扩增子的一种或多种引物。“多重PCR”指在同一反应混合物中同时扩增多种靶序列(或单一靶序列和一种或多种参比序列)的PCR,例如Bernard等,Anal.Biochem.,273:221-228(1999)(双色实时PCR)。通常,每种待扩增序列使用独特的引物组。“定量PCR”指设计用于测定样品或试样中一种或多种特定靶序列的丰度的PCR。定量PCR技术为本领域普通技术人员所熟知,例如参见下述参考文献:Freeman等,Biotechniques,26:112-126(1999);Becker-Andre等,Nucleic Acids Research,17:9437-9447(1989);Zimmerman等,Biotechniques,21:268-279(1996);Diviacco等,Gene,122:3013-3020(1992);Becker-Andre等,NucleicAcids Research,17:9437-9446(1989)等。
滚环扩增(RCA)(Zhong(2001)Proc.Natl.Acad.Sci.USA 98(7):3940-3945)表示普罗尼(polony)扩增的另一种形式,因为其连续复制并且不需要热循环。在只有一种引物(或切口)时,其以与时间成线性关系的速率由其原始环生长出长尾。环状或线性核酸模板的等温扩增还可以根据Tabor和Richardson(WO 00/41524)使用这样的方法进行,所述方法中核酸分子的酶促合成在不存在寡核苷酸引物的情况下发生。当包括来自相对链的第二引物时,将产生高度分支化的结构,质量相对于时间最初呈指数级地增长(m=k*exp(t),或至少m=kt2)。
本文所述RCA过程的建模表明了在3D阵列中随时间、化学和光学模式变化建立层的方式。如果复制起始于玻璃载玻片平面(或其它表面)的非均匀层,那么聚合反应只可以在下一个纳米厚的层中发生。RCA中聚合酶的链置换作用(如etaPol或eta样BstPol)需要切口或引物以启动链置换的DNA合成。如果将一些RCA引物固定,那么超支化的DNA产物在空间和时间上将会相当稳定。百万像素微镜光学器件可以获得粗糙(微米级,5Hz)图案,而自由运行或RNAPol-etaDNAPol-融合步进器将提供更精细的细节(nm,250Hz)。纳米级记录不一定是“多余的”,也不受微米级光模式的限制,因为它包含时间分量。厚度以及因此而得的记录容量将受到分别用于定位和记录的特定NTP和/或dNTP脉冲的时空精度的影响。
在优选实施方式中,沉淀的层可以包括连接(或由…放置的)核酸的多种化学物质。在一个方面,针对四种dNTP的每一种研发了氧化还原敏感的荧光团“侧链”。在另一方面,四种dNTP的每一种dNTP的光敏感型可以使用本领域已知的方法研发(Rob Mitra,未出版数据(2000))。在另一方面,可以通过该方法组装金属结合基团和线(Braun(1998)Nature391(6669):775-778)、量子点(Michler(2000)Nature 406(6799):968-70)、量子线(Emiliani(2001)J.Microsc.202(Pt 1):229-240)、磁点(Cowburn(2000)Science 287(5457):1466-1468)或折射点(Yguerabide(1998)Anal.Biochem.262(2):157-76)。本发明的3D阵列提供了基于信号一致性和/或通信水平的快速电光途径(类似于神经回路中的学习和计算)。在RCA中找到天然超支化结构是该监测中的第一步。
从头聚合物可以在有或没有聚合酶扩增的情况下储存和读取。扩增可以经由热循环或等温的。扩增子可以很短(100-200聚体,因为这对于目前的化学合成来说便于使用,或者可以达到1Mbp,因为这是聚合酶可以实现的。
测序
纳入的核苷酸类型可以这样确定:a)与该时间点存在于dNTP溶液循环模式中的特定dNTP(或rNTP或其它单体类型)一致的光脉冲的交集;b)“笼状的(caged)”(即,可光活化的或非可光活化的)dNTP、rNTP或阳离子;c)碱基特异性、光调节空间或构象选择性(参见Hoppmann C,Schmieder P,Heinrich N,Beyermann M.(2011)Chembiochem.12(17):2555-9.doi:10.1002/cbic.201100578.Epub 2011年10月13日.可光切换点击氨基酸:构象和生物活性的光控制(Photoswitchable click amino acids:light control ofconformation and bioactivity))。多聚(A)聚合酶尤其有用,因为相对于其它rNTP,其对于ATP的特异性是因为构象改变,而该构象改变可通过光敏感性氨基酸连接(如偶氮苯,无论其是否交联)模拟。
本文所述的方法能够生成大量数据(数十亿比特)。相应地,可以使用高通量方法对这些核酸分子进行测序,如Mitra(1999)Nucleic Acids Res.27(24):e34;1-6页中公开的方法。在优选的实施方式中,高通量方法与PCR扩增子或其它长度小于100bp的核酸分子使用。在其他优选的实施方式中,可以使用100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1000bp或更大bp的PCR扩增子。
滚环扩增(RCA)(Zhong(2001)Proc.Natl.Acad.Sci.USA 98(7):3940-3945)表示普罗尼(polony)扩增的另一种形式,因为其连续复制并且不需要热循环。在只有一种引物(或切口)时,其以与时间线性成线性关系的速率由其原始环生长出长尾。环状或线性核酸模板的等温扩增还可以根据Tabor和Richardson(WO 00/41524)使用这样的方法进行,所述方法中核酸分子的酶促合成方式在不存在寡核苷酸引物的情况下。
可用于本公开的测序方法包括:Shendure等.,进化细菌基因组的准确多重普罗尼测序(Accurate multiplex polony sequencing of an evolved bacterial genome),Science,309卷,1728-32页.2005;Drmanac等.,使用对自组装DNA纳米阵列的解链的碱基读数的人基因组测序(Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays),Science,327卷,78-81页.2009;McKernan等.,通过使用双碱基编码的短读大规模平行连接测序揭示的人类基因组中的序列和结构变异(Sequenceand structural variation in a human genome uncovered by short-read,massivelyparallel ligation sequencing using two-base encoding),Genome Res.,19卷,1527-41页.2009;Rodrigue等.,对宏基因组学进行短读测序(Unlocking short readsequencing for metagenomics),PLoS One,28等,e11840.2010;Rothberg等.,能够进行非光学基因组测序的集成半导体装置(An integrated semiconductor device enablingnon-optical genome sequencing),Nature,475卷,348-352页.2011;Margulies等.,在显微制造的高密度皮升反应器中进行基因组测序(Genome sequencing in microfabricatedhigh-density picolitre reactors),Nature,437卷,376-380页.2005;Rasko等.在德国导致溶血性尿毒症综合征爆发的大肠杆菌菌株的来源(Origins of the E.coli straincausing an outbreak of hemolytic-uremic syndrome in Germany),N.Engl.J.Med.,Epub.2011;Hutter等.,具有可逆终止氨基烷氧基团的标记的核苷三磷酸(Labelednucleoside triphosphates with reversibly terminating aminoalkoxyl groups),Nucleos.Nucleot.Nucl.,92卷,879-895页.2010;Seo等.,使用可光切割的荧光核苷酸在芯片上通过合成的四色DNA测序(Four-color DNA sequencing by synthesis on a chipusing photocleavable fluorescent nucleotides),Proc.Natl.Acad.Sci.USA.,102卷,5926-5931页(2005);Olejnik等.;可光切割的生物素衍生物:分离生物分子的通用方法(Photocleavable biotin derivatives:a versatile approach for the isolation ofbiomolecules),Proc.Natl.Acad.Sci.U.S.A.,vol.92,p.7590-7594.1995;US 5,750,34;US 2009/0062129和US 2009/0191553。
根据本公开内容的测序引物是这样的,其能够结合靶标多核苷酸的已知结合区域并促进本公开的寡核苷酸探针的连接。可以在计算机软件的协助下设计测序引物,如DNAWorks、或Gene2Oligo。结合区域长度可以不同,但是应当长到足以杂交测序引物。靶标多核苷酸可以具有多个不同结合区域,因此允许靶标多核苷酸的不同部分被测序。选择测序引物以形成高稳定性双链体,从而使其在连续的连接循环中保持杂交。可选择测序引物,从而使连接可以5’-3’方向或3’-5’方向或两者进行。测序引物可以包括修饰的核苷酸或键以增强其杂交效率,或者改善其稳定性,或者防止由一个末端向其它末端的延伸。
根据一个方面,单链DNA模板(ssDNA)通过RCA制备,以与测序引物使用。或者,将单链模板与乳液中的纳米颗粒或珠连接,并通过eRCR扩增。产物是具有单一扩增的ssDNA模板的克隆珠。
出于平行鉴定若干模板核苷酸序列的目的,将模板在pH 7.4的PBS缓冲液中稀释,并且使用多种连接方法与图案化或未图案化的基材结合,如生物素-链霉亲和素、叠氮化物-烷基化物(例如,点击化学)、NHS酯或硅烷化(例如,醛-,环氧-,氨基-硅烷)。根据一个方面,集落(rolony)连接于图案化的表面(如SiO2固体表面),其用1%氨基硅烷(v/v)处理并使其相互作用一段时间(常在5分钟至2小时)。然后使用洗涤1缓冲液洗去任何未结合的模板。
然后,制备测序引物并将其杂交于测序引物杂交位置。根据某些方面,可以制备这样的测序引物,其可以与模板的已知序列杂交。或者,在模板制备期间,通过连接、扩增、移位或重组的方式,根据本领域技术人员已知或本文所述的方法,将具有已知核酸序列的衔接体添加至未知核酸序列。再或者,可使用具有特定简并性水平的测序引物与沿着模板的特定位置杂交。根据一个方面,引物简并性被用于允许引物沿着模制进行半随机的杂交。根据本领域技术人员已知的统计方法选择引物简并性,以促进沿着模板长度的特定区间的引物杂交。根据这一方面,可以设计具有特定简并性的引物,所述特定简并性促进每N个碱基,如每100个碱基、每200个碱基、每2000个碱基、每100,000个碱基的结合。沿着模板长度结合引物基于引物的设计以及设计的引物将会沿着模板的长度约每N个碱基发生结合的统计学可能性。因为测序引物P1将会通过连接延伸,通常这样合成测序引物的末端接团,使其能够易于通过DNA连接酶共价地连接寡核苷酸探针。如果连接发生在测序引物的5’末端和寡核苷酸探针的3’末端之间,那么磷酸基团(5’-PO4)必须存在于测序引物上,而羟基(3’-OH)必须存在于寡核苷酸探针上,反之亦然。为了将测序序列杂交至测序引物杂交位点,使用了1uM在5X SSPE缓冲液中稀释的测序引物。然后,将混合物以高于室温的温度孵育数分钟,以刺激适当的退火(通常在1-5分钟之间,以25-55℃之间的温度)。
将HTML文件编码到DNA区段中
根据某些方面,可将如文本的信息转换成HTML格式(具有嵌入的jpg图像),并且然后以比特形式读取。将单个比特转换成针对0的A或C和针对1的T或G。比特流的地址长19比特并且连续编号,如从0000000000000000001开始。以下名为Bits2DNA.pl的程序被用于将HTML文件编码成DNA区段。
本文公开方法的应用可采用常规生物学方法、软件、计算机和计算机系统。相应地,本文所述方法可以全部或部分是计算机实现的方法。在本公开的方法中利用的计算机软件包括具有用于执行本发明方法逻辑步骤的计算机可执行指令的计算机可读介质。合适的计算机可读介质包括但不限于软盘、CD-ROM/DVD/DVD-ROM、硬盘驱动器、闪存、ROM/RAM、磁带和其它可以使用的计算机可读介质。计算机可执行指令可以用合适的计算机语言或几种计算机语言的组合来编写。本文所述的方法还可以利用各种市售可得的计算机和计算机程序产品和软件用于各种目的,包括将文本或图像转换成二进制码,设计表示二进制码的核酸序列,分析来自核酸序列的测序数据,将核酸序列数据转换成二进制码,以及将二进制码转换成文本或图像。
某些方法的实施方式
本公开的实施方式包括产生二进制编码的聚合物的方法,所述方法包括如下步骤:用这样的延伸产物重复延伸生长的聚合物链,该延伸产物是(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或者(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且其中,该延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且其中,第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且其中,第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且,当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的第一单体和第二单体之间交替,并且其中,所述二进制编码的聚合物编码文本或图像或视频或音频格式。根据一个方面,聚合物是核酸。根据一个方面,第一单体对的第一单体或第二单体是核苷酸。根据一个方面,第二单体对的第一单体或第二单体是核苷酸。根据一个方面,第一单体对包括腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)。根据一个方面,第二单体对包括胞嘧啶(C)和鸟嘌呤(G)。根据一个方面,使用酶和选定单体在催化所选单体添加的条件下形成延伸产物。根据一个方面,使用聚合酶和选定单体在催化所选单体添加的条件下形成延伸产物。根据一个方面,使用非模板依赖性聚合酶和选定单体在催化所选单体添加的条件下形成延伸产物。根据一个方面,生长的聚合物链连接基材。根据一个方面,提供了由步骤(i)和(ii)形成的多个生长的聚合物链。根据一个方面,提供了由步骤(i)和(ii)形成的多个生长的聚合物链,并且其中多个生长的聚合物链连接基材。根据一个方面,第一单体对的第一单体或第二单体是天然核苷酸。根据一个方面,第二单体对的第一单体或第二单体是天然核苷酸。根据一个方面,第一和第二单体对包括天然核苷酸,并且在足以添加单个核苷酸或超过一个核苷酸的条件下通过催化天然核苷酸添加来制备延伸产物。根据一个方面,第一和第二单体对包括天然核苷酸,并且这样制备延伸产物,即通过在基材上的一个或多个位置交替用核苷酸缺陷型缓冲液给予聚合酶和选定核苷酸,以在足以添加核苷酸的条件下催化天然核苷酸添加。
根据一个方面,提供了一种产生二进制编码的聚合物的方法,所述方法包括如下步骤:用这样的延伸产物重复延伸生长的聚合物链,该延伸产物是(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或者(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且其中,该延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且其中,第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且其中,第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且,当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的第一单体和第二单体之间交替,并且其中延伸产物包括第一单体对的第一单体或第二单体的至少一个均聚物或第二单体对的第一单体或第二单体的至少一个均聚物,并且其中二进制编码的聚合物编码文本或图像或视频或音频格式。
根据一个方面,提供了一种将二进制编码的核酸由核酸序列转换成代表文本或图像或视频或音频格式的二进制信息比特序列的方法,其中腺嘌呤和胸腺嘧啶或尿嘧啶代表第一二进制信息比特,胞嘧啶和鸟嘌呤代表第二二进制信息比特,所述方法包括如下步骤:读取核酸序列和将第一二进制信息比特分配给各腺嘌呤或超过一个腺嘌呤(当其是连续时),将第一二进制信息比特分配给各胸腺嘧啶或超过一个胸腺嘧啶(当其是连续时),将第一二进制信息比特分配给各尿嘧啶或超过一个尿嘧啶(当其是连续时),将第二二进制信息比特分配给各胞嘧啶或超过一个胞嘧啶(当其是连续时),并且将第二二进制信息比特分配给各鸟嘌呤或超过一个鸟嘌呤(当其是连续的),其中核酸序列包括连续的两个或多个腺嘌呤,连续的两个或多个胸腺嘧啶,连续的两个或多个尿嘧啶,连续的两个或多个胞嘧啶或连续的两个或多个鸟嘌呤中的至少一个。
根据一个方面,提供了一种对文本或图像或视频或音频格式进行编码和解码的方法,所述方法包括如下步骤:将文本或图像或视频或音频格式转换成比特流的多个比特序列,通过将腺嘌呤或胸腺嘧啶分配给第一二进制信息比特并将胞嘧啶或鸟嘌呤分配给第二二进制信息比特,设计对应比特流的多个比特序列的核酸序列,其中,当相同二进制信息比特连续直接出现时,交替分配给腺嘌呤或胸腺嘧啶,其中,当相同二进制信息比特连续直接出现时,交替分配给胞嘧啶或鸟嘌呤,合成核酸序列,存储合成的核酸序列,读取合成的核酸序列,并且通过将第一二进制信息比特分配到腺嘌呤或胸腺嘧啶并将第二二进制信息比特分配到胞嘧啶或鸟嘌呤,将合成的核酸序列解码成比特流的多个比特序列。根据一个方面,合成的核酸序列包括腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤均聚物的至少一种,并且其中将合成的核酸序列解码包括将第一二进制信息比特分配给腺嘌呤或胸腺嘧啶均聚物,或将第二二进制信息比特分配给胞嘧啶或鸟嘌呤均聚物
根据一个方面,提供了使用核酸序列在基材储存信息的方法,所述核酸序列表示编码文本或图像或视频或音频格式的比特流的多个比特序列,所述方法包括如下步骤:提供具有连接阵列上区域的单链核酸引发剂序列的基材,用这些物质接触一个或多个位置,所述物质是非模板依赖性聚合酶,选定的天然核苷酸以及Co2+、Mn2+、Zn2+和Mg2+中的一种或多种,催化选定的天然核苷酸在位于一个或多个位置的靶标单链核酸引发剂序列的3'羟基末端的添加,并且重复添加选定的天然核苷酸的催化步骤以产生位于基材已知位置的多个预定序列,其中,所述多个预定序列表示编码文本或图像或视频或音频格式的比特流的多个比特序列。根据一个方面,催化和重复步骤在基材的多个位置连续进行以产生位于基材已知位置的多个预定序列。根据一个方面,催化和重复步骤在基材的多个位置同时进行以产生多个预定序列,其各自位于基材的相应已知位置以在相应已知位置产生预定序列的阵列。根据一个方面,对多个预定序列中的一个或多个进行测序,并且将序列转换成二进制比特信息,然后将其转换成文本或图像或视频或音频格式。根据一个方面,基材包括至少102、103、104、105、106、107、108、109、1010个预定序列,其各自位于相应的已知区域。根据一个方面,预定序列的长度大于100个核苷酸、500个核苷酸、或1000个核苷酸。根据一个方面,非模板依赖性聚合酶是末端脱氧核苷酸转移酶。根据一个方面,天然核苷酸的延伸产物是通过限制天然核苷酸的反应时间产生的,其中,加入无核苷酸缓冲液以去除天然核苷酸,从而限制其反应时间,或者在天然核苷酸流过基材表面的脉冲速率的情况中,限制其在特定所需位置的反应时间。
根据一个方面,提供了一种将二进制编码的核酸由核酸序列转换成二进制信息比特序列的方法,其中腺嘌呤和胸腺嘧啶或尿嘧啶表示第一二进制信息比特,并且胞嘧啶和鸟嘌呤表示第二二进制信息比特,所述方法包括如下步骤:读取核酸序列和将第一二进制信息比特分配给各腺嘌呤或超过一个腺嘌呤(当其是连续时),将第一二进制信息比特分配给各胸腺嘧啶或超过一个胸腺嘧啶(当其是连续时),将第一二进制信息比特分配给各尿嘧啶或超过一个尿嘧啶(当其是连续时),将第二二进制信息比特分配给各胞嘧啶或超过一个胞嘧啶(当其是连续时),并且将第二二进制信息比特分配给各鸟嘌呤或超过一个鸟嘌呤(当其是连续的)。
根据一个方面,提供了一种包含存储的信息的存储装置,其包括基材和设置在基材上的多个核酸序列,其中所述多个核酸序列编码对应于存储的信息的连续的二进制信息比特,并且其中腺嘌呤或连续的腺嘌呤、胸腺嘧啶或连续的胸腺嘧啶和尿嘧啶或连续的尿嘧啶表示第一二进制信息比特,并且其中胞嘧啶或连续的胞嘧啶和鸟嘌呤或连续的鸟嘌呤代表第二二进制信息比特。
根据一个方面,提供了一种使用核苷酸储存信息的方法,所述方法包括如下步骤:将一种格式的信息转换成比特流的多个比特序列,其各自具有相应的比特条码,使用各编码的碱基一个比特将所述多个比特序列转换成多个相应的寡核苷酸序列,通过脉冲和同步试剂和洗剂穿过具有多个反应位置的基材表面合成多个相应的寡核苷酸序列,并且将合成的多个相应的寡核苷酸序列储存。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。
根据一个方面,提供了一种从多个合成的寡核苷酸序列检索一种格式的信息的方法,所述合成的寡核苷酸序列编码一种格式的信息的比特序列,所述方法包括:扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列转化成比特序列,并且将比特序列转换成一种格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。
根据一个方面,提供了一种由多个合成的寡核苷酸序列访问一种格式的信息的方法,所述合成的寡核苷酸序列编码一种格式的信息的比特序列,所述方法包括:扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列转化成比特序列,将比特序列转换成一种格式的信息,并且输出该格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。
根据一个方面,提供了一种使用核苷酸储存信息的方法,所述方法包括如下步骤:将一种格式的信息转换成比特流,将比特序列编码成相应的寡核苷酸序列,通过脉冲和同步试剂和洗剂穿过具有多个反应位置的基材表面合成寡核苷酸序列,对寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列解码成比特序列,将比特序列组装成比特流,并且将比特流转换成该格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。
根据一个方面,提供了一种使用核苷酸储存信息的方法,所述方法包括如下步骤:将第一格式的信息转换成第一比特流,将第一比特序列编码成相应的寡核苷酸序列,通过脉冲和同步试剂和洗剂穿过具有多个反应位置的基材表面合成寡核苷酸序列,对寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列解码成第二比特序列,将第二比特序列组装成比特流,并且将第二比特流转换成第二格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。
贯穿本发明中所引用的所有参考文献、专利和公开专利申请的内容通过引用全文纳入本文并用于所有目的。
其他实施方式
其他实施方式对于本领域技术人员而言将是显而易见的。应当理解的是,前述仅为了清楚描述而提供,并且仅仅是示范性的。本发明的精神和范围并不限于上述示例,而是被所述权利要求所包括。本文中应用的所有公开、专利和专利申请通过引用全文纳入本文用于所有目的,就如同各公开、专利被具体地且单独地说明通过引用纳入本文一样。

Claims (40)

1.一种产生二进制编码的聚合物的方法,所述方法包括:
用这样的延伸产物重复延伸生长的聚合物链,所述延伸产物是:
(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或
(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且
其中,所述延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且
其中,所述第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且
其中,所述第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且
当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的所述第一单体和所述第二单体之间交替,并且
其中,所述二进制编码的聚合物编码所述文本或图像或视频或音频格式。
2.如权利要求1所述的方法,其中,所述聚合物是核酸。
3.如权利要求1所述的方法,其中,所述第一单体对的第一单体或第二单体是核苷酸。
4.如权利要求1所述的方法,其中,所述第二单体对的第一单体或第二单体是核苷酸。
5.如权利要求1所述方法,其中,所述第一单体对包括腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)。
6.如权利要求1所述的方法,其中,所述第二单体对包括胞嘧啶(C)和鸟嘌呤(G)。
7.如权利要求1所述的方法,其中,使用酶和选定单体在催化所述选定单体添加的条件下形成所述延伸产物。
8.如权利要求1所述的方法,其中,使用聚合酶和选定单体在催化所述选定单体添加的条件下形成所述延伸产物。
9.如权利要求1所述的方法,其中,使用非模板依赖性聚合酶和选定单体在催化所述选定单体添加的条件下形成所述延伸产物。
10.如权利要求1所述的方法,所述生长的聚合物链连接基材。
11.如权利要求1所述的方法,包括由步骤(i)和(ii)形成的多个生长的聚合物链。
12.如权利要求1所述的方法,包括由步骤(i)和(ii)形成的多个生长的聚合物链,并且其中所述多个生长的聚合物链连接基材。
13.如权利要求1所述的方法,其中,所述第一单体对的第一单体或第二单体是天然核苷酸。
14.如权利要求1所述的方法,其中,所述第二单体对的第一单体或第二单体是天然核苷酸。
15.如权利要求1所述的方法,其中,所述第一和第二单体对包括天然核苷酸,并且在足以添加单个核苷酸或超过一个核苷酸的条件下通过催化天然核苷酸添加来制备延伸产物。
16.如权利要求1所述的方法,其中,所述第一和第二单体对包括天然核苷酸,并且这样制备延伸产物;通过在基材上一个或多个位置交替用核苷酸缺陷型缓冲液给予聚合酶和选定核苷酸,在足以添加核苷酸的条件下催化天然核苷酸添加。
17.一种产生二进制编码的聚合物的方法,所述方法包括:
用这样的延伸产物重复延伸生长的聚合物链,所述延伸产物是:
(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或
(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且
其中,所述延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且
其中,所述第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且
其中,所述第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且
当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的所述第一单体和所述第二单体之间交替,并且
其中,所述延伸产物包括所述第一单体对的第一单体或第二单体的至少一个均聚物或所述第二单体对的第一单体或第二单体的至少一个均聚物,并且
其中,所述二进制编码的聚合物编码所述文本或图像或视频或音频格式。
18.一种将二进制编码的核酸由核酸序列转换成表示文本或图像或视频或音频格式的二进制信息比特序列的方法,其中腺嘌呤和胸腺嘧啶或尿嘧啶表示第一二进制信息比特,并且胞嘧啶和鸟嘌呤表示第二二进制信息比特,所述方法包括:
读取所述核酸序列,并且
将所述第一二进制信息比特分配给各腺嘌呤或连续的超过一个腺嘌呤,
将所述第一二进制信息比特分配给各胸腺嘧啶或连续的超过一个胸腺嘧啶,
将所述第一二进制信息比特分配给各尿嘧啶或连续的超过一个尿嘧啶,
将所述第二二进制信息比特分配给各胞嘧啶或连续的超过一个胞嘧啶,和
将所述第二二进制信息比特分配给各鸟嘌呤或连续的超过一个鸟嘌呤,
其中,所述核酸序列包括以下至少其一:连续的两个或多个腺嘌呤,连续的两个或多个胸腺嘧啶,连续的两个或多个尿嘧啶,连续的两个或多个胞嘧啶或连续的两个或多个鸟嘌呤。
19.一种对文本或图像或视频或音频格式进行编码和解码的方法,所述方法包括:
将所述文本或图像或视频或音频格式转换成比特流的多个比特序列,
通过将腺嘌呤或胸腺嘧啶分配给第一二进制信息比特并将胞嘧啶或鸟嘌呤分配给第二二进制信息比特,设计对应所述比特流的多个比特序列的核酸序列,
其中,当相同二进制信息比特直接连续出现时,交替分配给腺嘌呤或胸腺嘧啶,
其中,当相同二进制信息比特直接连续出现时,交替分配给胞嘧啶或鸟嘌呤,
合成所述核酸序列,
储存所述合成的核酸序列,
读取所述合成的核酸序列,并且
通过将所述第一二进制信息比特分配到腺嘌呤或胸腺嘧啶并将所述第二二进制信息比特分配到胞嘧啶或鸟嘌呤,将所述合成的核酸序列解码成所述比特流的多个比特序列。
20.如权利要求19所述的方法,其中,所述合成的核酸序列包括腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤至少其一的聚合物,并且其中所述将合成的核酸序列解码包括将所述第一二进制信息比特分配给腺嘌呤或胸腺嘧啶均聚物,或将所述第二二进制信息比特分配给胞嘧啶或鸟嘌呤均聚物。
21.一种使用核酸序列在基材上储存信息的方法,所述核酸序列表示编码文本或图像或视频或音频格式的比特流的多个比特序列,所述方法包括:
提供具有连接阵列上区域的单链核酸引发剂序列的基材,用以下物质接触一个或多个位置:非模板依赖性聚合酶,选定的天然核苷酸,以及Co2+、Mn2+、Zn2+和Mg2+中的一种或多种,
催化选定的天然核苷酸在位于一个或多个位置添加至靶标单链核酸引发剂序列的3'羟基末端,并且
重复催化添加选定的天然核苷酸的步骤以产生位于基材已知位置的多个预定序列,其中,所述多个预定序列表示编码所述文本或图像或视频或音频格式的比特流的多个比特序列。
22.如权利要求21所述的方法,其中,所述催化和重复步骤在基材的多个位置连续进行以产生位于基材已知位置的多个预定序列。
23.如权利要求21所述的方法,其中所述催化和重复步骤在基材的多个位置同时进行以产生多个预定序列,其各自位于基材的相应已知位置以在相应已知位置产生预定序列的阵列。
24.如权利要求21所述的方法,其中,对所述多个预定序列中的一个或多个进行测序,并且将所述序列转换成二进制比特信息,然后将其转换成所述文本或图像或视频或音频格式。
25.如权利要求21所述的方法,其中,所述基材包括至少102、103、104、105、106、107、108、109、1010个预定序列,其各自位于相应的已知区域。
26.如权利要求21所述方法,其中,所述预定序列的长度大于100个核苷酸、500个核苷酸、或1000个核苷酸。
27.如权利要求21所述的方法,其中,所述非模板依赖性聚合酶是末端脱氧核苷酸转移酶。
28.如权利要求21所述的方法,其中,通过限制所述天然核苷酸的反应时间产生所述天然核苷酸的延伸产物,其中,加入无核苷酸缓冲液以去除所述天然核苷酸,从而限制其反应时间,或者由所述天然核苷酸流过基材表面的脉冲速率,限制其在特定所需位置的反应时间。
29.一种将二进制编码的核酸由核酸序列转换成二进制信息比特序列的方法,其中腺嘌呤和胸腺嘧啶或尿嘧啶表示第一二进制信息比特,并且胞嘧啶和鸟嘌呤表示第二二进制信息比特,所述方法包括:
读取所述核酸序列,并且
将所述第一二进制信息比特分配给各腺嘌呤或连续的超过一个腺嘌呤,
将所述第一二进制信息比特分配给各胸腺嘧啶或连续的超过一个胸腺嘧啶,
将所述第一二进制信息比特分配给各尿嘧啶或连续的超过一个尿嘧啶,
将所述第二二进制信息比特分配给各胞嘧啶或连续的超过一个胞嘧啶,和
将所述第二二进制信息比特分配给各鸟嘌呤或连续的超过一个鸟嘌呤。
30.一种包含存储的信息的存储装置,其包括基材和设置在基材上的多个核酸序列,其中,所述多个核酸序列编码对应于存储的信息的连续二进制信息比特,并且其中腺嘌呤或连续的腺嘌呤、胸腺嘧啶或连续的胸腺嘧啶和尿嘧啶或连续的尿嘧啶表示第一二进制信息比特,并且
其中,胞嘧啶或连续的胞嘧啶和鸟嘌呤或连续的鸟嘌呤代表第二二进制信息比特。
31.一种使用核苷酸储存信息的方法,所述方法包括:将一个格式的信息转换成比特流的多个比特序列,其各自具有相应的比特条码,使用每个编码的碱基一个比特将所述多个比特序列转换成多个相应的寡核苷酸序列,通过脉冲和同步试剂和洗剂穿过具有多个反应位置的基材表面合成所述多个相应的寡核苷酸序列,并且将所述合成的多个相应的寡核苷酸序列储存。
32.如权利要求31所述的方法,其中,所述寡核苷酸序列包括一个或多个或所有数据块序列,在所述比特流中指定所述数据块位置的地址序列,或位于所述寡核苷酸各末端用于扩增和测序的侧接共同序列。
33.一种从多个合成的寡核苷酸序列检索信息格式的方法,所述合成的寡核苷酸序列编码所述信息格式的比特序列,所述方法包括扩增所述多个寡核苷酸序列,对所述扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将所述寡核苷酸序列转化成比特序列,并且将所述比特序列转换成所述格式的信息。
34.如权利要求33所述的方法,其中,所述寡核苷酸序列包括一个或多个或所有数据块序列,在所述比特流中指定所述数据块位置的地址序列,或位于所述寡核苷酸各末端用于扩增和测序的侧接共同序列。
35.一种从多个合成的寡核苷酸序列访问信息格式的方法,所述合成的寡核苷酸序列编码所述信息格式的比特序列,所述方法包括扩增所述多个寡核苷酸序列,对所述扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将所述寡核苷酸序列转化成比特序列,将所述比特序列转换成所述格式的信息,并且输出所述格式的信息。
36.如权利要求35所述的方法,其中,所述寡核苷酸序列包括一个或多个或所有数据块序列,在所述比特流中指定所述数据块位置的地址序列,或位于所述寡核苷酸各末端用于扩增和测序的侧接共同序列。
37.一种使用核苷酸储存信息的方法,所述方法包括将一种格式的信息转换成比特流,将比特序列编码成相应的寡核苷酸序列,通过脉冲和同步试剂和洗剂穿过具有多个反应位置的基材表面合成所述寡核苷酸序列,对所述寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将所述寡核苷酸序列解码成比特序列,将所述比特序列组装成比特流,并且将所述比特流转换成所述格式的信息。
38.如权利要求37所述的方法,其中,所述寡核苷酸序列包括一个或多个或所有数据块序列,在所述比特流中指定所述数据块位置的地址序列,或位于所述寡核苷酸各末端用于扩增和测序的侧接共同序列。
39.一种使用核苷酸储存信息的方法,所述方法包括将第一种格式的信息转换成第一比特流,将第一比特序列编码成相应的寡核苷酸序列,通过脉冲和同步试剂和洗剂穿过具有多个反应位置的基材表面合成所述寡核苷酸序列,对所述寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将所述寡核苷酸序列解码成第二比特序列,将所述第二比特序列组装成第二比特流,并且将所述第二比特流转换成第二格式的信息。
40.如权利要求39所述的方法,其中,所述寡核苷酸序列包括一个或多个或所有数据块序列,在所述比特流中指定所述数据块位置的地址序列,或位于所述寡核苷酸各末端用于扩增和测序的侧接共同序列。
CN201680052866.4A 2015-07-13 2016-07-13 使用核酸用于可检索信息储存的方法 Pending CN108026557A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562191982P 2015-07-13 2015-07-13
US62/191,982 2015-07-13
PCT/US2016/041981 WO2017011492A1 (en) 2015-07-13 2016-07-13 Methods for retrievable information storage using nucleic acids

Publications (1)

Publication Number Publication Date
CN108026557A true CN108026557A (zh) 2018-05-11

Family

ID=57757482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680052866.4A Pending CN108026557A (zh) 2015-07-13 2016-07-13 使用核酸用于可检索信息储存的方法

Country Status (6)

Country Link
US (3) US9928869B2 (zh)
EP (1) EP3322812B1 (zh)
JP (2) JP6920275B2 (zh)
KR (1) KR20180030092A (zh)
CN (1) CN108026557A (zh)
WO (1) WO2017011492A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427786A (zh) * 2019-05-31 2019-11-08 西藏自治区人民政府驻成都办事处医院 一种用dna作为文字信息高效存储介质的方法
WO2020042582A1 (zh) * 2018-08-28 2020-03-05 华为技术有限公司 一种dna数据的存储方法和装置
CN112242978A (zh) * 2019-07-18 2021-01-19 京东数字科技控股有限公司 一种处理数据的方法和装置
CN112288089A (zh) * 2020-09-28 2021-01-29 清华大学 阵列式核酸信息存储方法及装置
CN112771215A (zh) * 2018-09-28 2021-05-07 哈佛学院院长等 使用分子混合物存储信息
CN112955251A (zh) * 2018-10-31 2021-06-11 微软技术许可有限责任公司 使用自组装膜的多核苷酸包封和保存

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI707038B (zh) 2013-08-05 2020-10-11 美商扭轉生物科技有限公司 重新合成之基因庫
WO2016126882A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
HK1258869A1 (zh) 2015-09-18 2019-11-22 Twist Bioscience Corporation 寡核酸变体文库及其合成
CN108698012A (zh) 2015-09-22 2018-10-23 特韦斯特生物科学公司 用于核酸合成的柔性基底
US9895673B2 (en) 2015-12-01 2018-02-20 Twist Bioscience Corporation Functionalized surfaces and preparation thereof
SG11201901563UA (en) 2016-08-22 2019-03-28 Twist Bioscience Corp De novo synthesized nucleic acid libraries
US10417457B2 (en) * 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
WO2018081113A1 (en) 2016-10-24 2018-05-03 Sawaya Sterling Concealing information present within nucleic acids
AU2017363139B2 (en) 2016-11-16 2023-09-21 Catalog Technologies, Inc. Nucleic acid-based data storage
US10650312B2 (en) 2016-11-16 2020-05-12 Catalog Technologies, Inc. Nucleic acid-based data storage
AU2017378492B2 (en) 2016-12-16 2022-06-16 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
US11550939B2 (en) 2017-02-22 2023-01-10 Twist Bioscience Corporation Nucleic acid based data storage using enzymatic bioencryption
EP3595674A4 (en) 2017-03-15 2020-12-16 Twist Bioscience Corporation BANKS OF VARIANTS OF IMMUNOLOGICAL SYNAPSE AND THEIR SYNTHESIS
WO2018217689A1 (en) * 2017-05-22 2018-11-29 The Charles Stark Draper Laboratory, Inc. Modified template-independent dna polymerase
US11612873B2 (en) * 2017-05-31 2023-03-28 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
US11174512B2 (en) 2017-05-31 2021-11-16 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
KR102583062B1 (ko) * 2017-05-31 2023-09-25 몰레큘러 어셈블리즈, 인크. 동종중합체 인코딩된 핵산 메모리
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
IL271205B2 (en) 2017-06-12 2025-02-01 Twist Bioscience Corp Methods for assembling continuous nucleic acids
CN109300508B (zh) * 2017-07-25 2020-08-11 南京金斯瑞生物科技有限公司 一种dna数据存储编码解码方法
WO2019040871A1 (en) * 2017-08-24 2019-02-28 Miller Julian DEVICE FOR ENCODING AND STORING INFORMATION USING ARTIFICIALLY EXPANDED ALPHABETS OF NUCLEIC ACIDS AND OTHER ANALOGOUS POLYMERS
GB2581620A (en) 2017-09-11 2020-08-26 Twist Bioscience Corp GPCR binding proteins and synthesis thereof
WO2019079802A1 (en) * 2017-10-20 2019-04-25 President And Fellows Of Harvard College METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA
CA3079613A1 (en) 2017-10-20 2019-04-25 Twist Bioscience Corporation Heated nanowells for polynucleotide synthesis
GB2585506A (en) 2018-01-04 2021-01-13 Twist Bioscience Corp DNA-based digital information storage
AU2019236289B2 (en) 2018-03-16 2024-12-05 Catalog Technologies, Inc. Chemical methods for nucleic acid-based data storage
EP3542903A1 (en) * 2018-03-22 2019-09-25 IMEC vzw Memory writing
EP3547315B1 (en) * 2018-03-26 2021-01-27 IMEC vzw Method of storing data
KR102138864B1 (ko) 2018-04-11 2020-07-28 경희대학교 산학협력단 Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법
EP3794598A1 (en) 2018-05-16 2021-03-24 Catalog Technologies, Inc. Compositions and methods for nucleic acid-based data storage
WO2019222650A1 (en) 2018-05-17 2019-11-21 The Charles Stark Draper Laboratory, Inc. Apparatus for high density information storage in molecular chains
CA3100739A1 (en) 2018-05-18 2019-11-21 Twist Bioscience Corporation Polynucleotides, reagents, and methods for nucleic acid hybridization
EP3826762A1 (en) 2018-07-23 2021-06-02 DNA Script Massively parallel enzymatic synthesis of nucleic acid strands
JP7576536B2 (ja) 2018-08-03 2024-10-31 カタログ テクノロジーズ, インコーポレイテッド 誤り保護とともに核酸に基づくデータを記憶および読むためのシステムおよび方法
US11017170B2 (en) * 2018-09-27 2021-05-25 At&T Intellectual Property I, L.P. Encoding and storing text using DNA sequences
AU2019398307A1 (en) 2018-12-13 2021-06-10 Dna Script Direct oligonucleotide synthesis on cells and biomolecules
US11249941B2 (en) * 2018-12-21 2022-02-15 Palo Alto Research Center Incorporated Exabyte-scale data storage using sequence-controlled polymers
EP3902816A4 (en) 2018-12-26 2022-09-14 Twist Bioscience Corporation HIGHLY ACCURATE POLYNUCLEOTIDE DE NOVO SYNTHESIS
AU2020227802A1 (en) 2019-02-26 2021-10-14 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
JP2022521551A (ja) 2019-02-26 2022-04-08 ツイスト バイオサイエンス コーポレーション Glp1受容体の変異体核酸ライブラリ
WO2020185896A1 (en) * 2019-03-11 2020-09-17 President And Fellows Of Harvard College Methods for processing and storing dna encoding formats of information
US11989216B2 (en) * 2019-04-09 2024-05-21 University Of Washington Systems and methods for providing similarity-based retrieval of information stored in DNA
EP3966823A1 (en) 2019-05-09 2022-03-16 Catalog Technologies, Inc. Data structures and operations for searching, computing, and indexing in dna-based data storage
GB201907460D0 (en) 2019-05-27 2019-07-10 Vib Vzw A method of storing information in pools of nucleic acid molecules
US11137385B2 (en) 2019-05-31 2021-10-05 Illumina, Inc. Obtaining information from a biological sample in a flow cell
CN112654719A (zh) * 2019-05-31 2021-04-13 伊鲁米纳公司 使用流动池进行信息存储和检索的系统和方法
KR102351683B1 (ko) * 2019-06-10 2022-01-17 서울대학교산학협력단 교차 수렴법을 이용한 정보가 저장된 폴리머의 제조방법
AU2020298294A1 (en) 2019-06-21 2022-02-17 Twist Bioscience Corporation Barcode-based nucleic acid sequence assembly
US11773422B2 (en) 2019-08-16 2023-10-03 Microsoft Technology Licensing, Llc Regulation of polymerase using cofactor oxidation states
WO2021041667A1 (en) * 2019-08-27 2021-03-04 President And Fellows Of Harvard College Modifying messages stored in mixtures of molecules using thin-layer chromatography
US11795450B2 (en) 2019-09-06 2023-10-24 Microsoft Technology Licensing, Llc Array-based enzymatic oligonucleotide synthesis
US12091777B2 (en) 2019-09-23 2024-09-17 Twist Bioscience Corporation Variant nucleic acid libraries for CRTH2
EP4034564A4 (en) 2019-09-23 2023-12-13 Twist Bioscience Corporation VARIANT NUCLEIC ACID LIBRARIES FOR SINGLE-DOMAIN ANTIBODIES
CA3157804A1 (en) 2019-10-11 2021-04-15 Catalog Technologies, Inc. Nucleic acid security and authentication
CN111489791B (zh) * 2020-04-07 2023-05-26 中国科学院重庆绿色智能技术研究院 固态纳米孔高密度编码dna数字存储读取方法
EP4538386A3 (en) 2020-05-11 2025-08-13 Catalog Technologies, Inc. Programs and functions in dna-based data storage
CN114058471A (zh) * 2020-07-29 2022-02-18 东南大学 负载了dna存储数据的数据存储装置、制备方法和读数方法
US12344876B2 (en) * 2020-10-30 2025-07-01 Microsoft Technology Licensing, Llc Spatially addressable control of polymerase activity
IL309044A (en) * 2021-06-14 2024-02-01 Primrose Bio Inc Preparations and methods for enzymatic nucleic acid synthesis
JP2024530614A (ja) * 2021-07-28 2024-08-23 ナイオ, インコーポレイテッド 核酸データストレージのための組成物、システム、および方法
TWI869710B (zh) * 2021-09-29 2025-01-11 呈堯 陳 用於無模板rna合成的核酸聚合酶變體、試劑套組及方法
WO2024026084A2 (en) * 2022-07-29 2024-02-01 Arizona Board Of Regents On Behalf Of The University Of Arizona Systems and methods for storage of digital information via biopolymers
KR102806249B1 (ko) * 2022-09-01 2025-05-14 서울대학교산학협력단 정보 저장용 서열 정의 고분자의 제조방법, 정보 저장 방법, 정보 디코딩 방법 및 정보 저장용 서열 정의 고분자
KR102810443B1 (ko) * 2023-01-17 2025-05-21 서울대학교산학협력단 정보 저장용 서열 정의 고분자의 제조방법, 정보 저장 방법, 정보 디코팅 로직 구축 방법 및 정보 디코딩 방법
DE102023204133A1 (de) * 2023-05-04 2024-11-07 Siemens Healthineers Ag Verfahren zum Bereitstellen eines Datenelementes
WO2025235993A1 (en) * 2024-05-10 2025-11-13 Tsui Tsz Kin Martin Methods and compositions for encoding and storing electronic data in biological contexts

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6312911B1 (en) * 1999-05-06 2001-11-06 Frank Carter Bancroft DNA-based steganography
US20030044781A1 (en) * 1999-05-19 2003-03-06 Jonas Korlach Method for sequencing nucleic acid molecules
WO2003025123A2 (en) * 2001-08-28 2003-03-27 Mount Sinai School Of Medecine Dna: a medium for long-term information storage specification
US20040006433A1 (en) * 2002-06-28 2004-01-08 International Business Machines Corporation Genomic messaging system
WO2004088585A2 (en) * 2003-03-31 2004-10-14 Council Of Scientific And Industrial Research A method for storing information in dna
US20050211012A1 (en) * 2004-03-25 2005-09-29 Teleflex, Inc. Pedal mount assembly
US20070113137A1 (en) * 2005-10-22 2007-05-17 Ho Seung Ryu Error Correction in Binary-encoded DNA Using Linear Feedback Shift Registers
CN102083998A (zh) * 2007-06-19 2011-06-01 斯特拉托斯基因公司 通过展开进行高通量核酸测序
CN104520864A (zh) * 2012-06-01 2015-04-15 欧洲分子生物学实验室 Dna中数字信息的高容量存储
CN104662544A (zh) * 2012-07-19 2015-05-27 哈佛大学校长及研究员协会 利用核酸存储信息的方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5917031A (en) 1996-04-19 1999-06-29 Taiko Pharmaceutical Co., Ltd. Method of synthesizing polydeoxyribonucleotides
KR100917731B1 (ko) 2001-05-11 2009-09-15 파나소닉 주식회사 생체분자 기판 및 그것을 이용한 검사 및 진단의 방법 및장치
GB0201966D0 (en) * 2002-01-29 2002-03-13 Smartwater Ltd Improvements in or relating to security products
US20030228611A1 (en) * 2002-05-01 2003-12-11 President And Fellows Of Harvard College Nucleic acid memory device
US20040060987A1 (en) 2002-05-07 2004-04-01 Green Larry R. Digital image analysis method for enhanced and optimized signals in fluorophore detection
US20040001371A1 (en) 2002-06-26 2004-01-01 The Arizona Board Of Regents On Behalf Of The University Of Arizona Information storage and retrieval device using macromolecules as storage media
JP4102157B2 (ja) 2002-10-17 2008-06-18 正幸 園部 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ
EP1907988B1 (en) 2005-06-20 2013-11-06 AuthentiForm Technologies, L.L.C. Systems and methods for product authentication
US7874489B2 (en) 2005-06-20 2011-01-25 Authentiform Technologies, Llc Product authentication
DE102007057802B3 (de) 2007-11-30 2009-06-10 Geneart Ag Steganographische Einbettung von Informationen in kodierenden Genen
US20110003701A1 (en) 2008-02-27 2011-01-06 454 Life Sciences Corporation System and method for improved processing of nucleic acids for production of sequencable libraries

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6312911B1 (en) * 1999-05-06 2001-11-06 Frank Carter Bancroft DNA-based steganography
US20030044781A1 (en) * 1999-05-19 2003-03-06 Jonas Korlach Method for sequencing nucleic acid molecules
WO2003025123A2 (en) * 2001-08-28 2003-03-27 Mount Sinai School Of Medecine Dna: a medium for long-term information storage specification
US20040006433A1 (en) * 2002-06-28 2004-01-08 International Business Machines Corporation Genomic messaging system
WO2004088585A2 (en) * 2003-03-31 2004-10-14 Council Of Scientific And Industrial Research A method for storing information in dna
US20050211012A1 (en) * 2004-03-25 2005-09-29 Teleflex, Inc. Pedal mount assembly
US20070113137A1 (en) * 2005-10-22 2007-05-17 Ho Seung Ryu Error Correction in Binary-encoded DNA Using Linear Feedback Shift Registers
CN102083998A (zh) * 2007-06-19 2011-06-01 斯特拉托斯基因公司 通过展开进行高通量核酸测序
CN104520864A (zh) * 2012-06-01 2015-04-15 欧洲分子生物学实验室 Dna中数字信息的高容量存储
CN104662544A (zh) * 2012-07-19 2015-05-27 哈佛大学校长及研究员协会 利用核酸存储信息的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MOTEA EA等: "Terminal Deoxynucleotidyl Transferase: The Story of a Misguided DNA Polymerase", 《BIOCHIMICA ET BIOPHYSICA ACTA-PROTEINS AND PROTEOMICS》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020042582A1 (zh) * 2018-08-28 2020-03-05 华为技术有限公司 一种dna数据的存储方法和装置
CN110867213A (zh) * 2018-08-28 2020-03-06 华为技术有限公司 一种dna数据的存储方法和装置
CN110867213B (zh) * 2018-08-28 2023-10-20 华为技术有限公司 一种dna数据的存储方法和装置
CN112771215A (zh) * 2018-09-28 2021-05-07 哈佛学院院长等 使用分子混合物存储信息
CN112955251A (zh) * 2018-10-31 2021-06-11 微软技术许可有限责任公司 使用自组装膜的多核苷酸包封和保存
CN112955251B (zh) * 2018-10-31 2023-02-28 微软技术许可有限责任公司 使用自组装膜的多核苷酸包封和保存
CN110427786A (zh) * 2019-05-31 2019-11-08 西藏自治区人民政府驻成都办事处医院 一种用dna作为文字信息高效存储介质的方法
CN112242978A (zh) * 2019-07-18 2021-01-19 京东数字科技控股有限公司 一种处理数据的方法和装置
CN112242978B (zh) * 2019-07-18 2023-04-07 京东科技控股股份有限公司 一种处理数据的方法和装置
CN112288089A (zh) * 2020-09-28 2021-01-29 清华大学 阵列式核酸信息存储方法及装置
CN112288089B (zh) * 2020-09-28 2022-12-20 清华大学 阵列式核酸信息存储方法及装置

Also Published As

Publication number Publication date
US20170337324A1 (en) 2017-11-23
WO2017011492A1 (en) 2017-01-19
EP3322812A4 (en) 2020-12-23
EP3322812B1 (en) 2022-05-18
US10289801B2 (en) 2019-05-14
US20170017436A1 (en) 2017-01-19
US11532380B2 (en) 2022-12-20
EP3322812A1 (en) 2018-05-23
US9928869B2 (en) 2018-03-27
JP2021058216A (ja) 2021-04-15
KR20180030092A (ko) 2018-03-21
US20190121936A1 (en) 2019-04-25
JP2018527900A (ja) 2018-09-27
JP6920275B2 (ja) 2021-08-18

Similar Documents

Publication Publication Date Title
US11532380B2 (en) Methods for using nucleic acids to store, retrieve and access information comprising a text, image, video or audio format
US12067434B2 (en) Methods of storing information using nucleic acids
CN109312493B (zh) 酶促核酸合成
US20190062804A1 (en) Method of Making Polynucleotides Using Closed-Loop Verification
CN110770356B (zh) 使用珠寡核苷酸的mda
CN107257862B (zh) 从多个引物测序以增加数据速率和密度
KR20160032723A (ko) 샘플 처리를 위한 조성물 및 방법
US20210207186A1 (en) Method of Making Polynucleotides Using an Anion Toroidal Vortex
WO2017189794A1 (en) Method of secure communication via nucleotide polymers
HK1210848B (zh) 利用核酸存儲信息的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180511