WO2025176862A1 - Verfahren und vorrichtung zum bestimmen von bindungsplätzen von proteinen an nukleinsäuren, insbesondere von transkriptionsfaktoren an dns - Google Patents
Verfahren und vorrichtung zum bestimmen von bindungsplätzen von proteinen an nukleinsäuren, insbesondere von transkriptionsfaktoren an dnsInfo
- Publication number
- WO2025176862A1 WO2025176862A1 PCT/EP2025/054757 EP2025054757W WO2025176862A1 WO 2025176862 A1 WO2025176862 A1 WO 2025176862A1 EP 2025054757 W EP2025054757 W EP 2025054757W WO 2025176862 A1 WO2025176862 A1 WO 2025176862A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- nucleic acids
- proteins
- dna
- bonds
- binding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Definitions
- bonds of the proteins to the nucleic acids are fixed by short laser pulses with a pulse duration of not more than 100 ns, and the nucleic acids with the fixed bonds are sequenced by passing them through nanopores.
- the nucleic acids to which the method according to the invention relates are, in particular, DNA, with the proteins in question being, in particular, transcription factors.
- the DNA to which the proteins bind is usually double-stranded DNA.
- the nucleic acids can be single-stranded DNA or RNA, although appropriate adaptation of sample preparation prior to the application of nanopore technology may be necessary.
- the double-stranded DNA is split into two single strands, one of which is then randomly selected and sequenced. It is generally advantageous to sequence both single strands of the double-stranded DNA. If only one of the two strands is sequenced, information about fixed bonds may be lost. Using so-called duplex basecalling, both strands can be sequenced directly one after the other, providing complementary information.
- the initial binding of the proteins to the nucleic acids can already occur before the method according to the invention is carried out.
- the nucleic acids can also be contacted with one or more proteins only at the beginning of the method according to the invention in order to bind these proteins to the nucleic acids.
- Fig. 2 is a flowchart of analysis steps following the steps according to Fig. 1 of an embodiment of the method according to the invention.
- Fig. 3A and B show quality scores of analyzed DNA libraries as they occur in the method according to the invention, Fig. 3B, right, and in comparison experiments, Fig. 3A and Fig. 3B, left.
- Fig. 5A and B show sequence information of a proof-of-concept study of the method according to the invention.
- Fig. 6A, B, C and D show preliminary sequencing results of cross-linked interactions of TBP with double-stranded DNA and corresponding controls in the proof-of-concept study.
- the method 1 according to the invention serves to determine binding sites of transcription factors 3 to DNA 4.
- the method 1 according to the invention can also be carried out to determine the binding sites 3 of other proteins 5 to other nucleic acids 6.
- a binding reactor 7 of a device 22 for carrying out the method 1 the respective protein 5 is contacted with the nucleic acid 6 in order to enable a binding reaction 8.
- hydrogen bonds typically form between the protein 5 and the nucleic acid 6, which are not sufficiently stable for the determination of the binding sites 2. Therefore, the bonds are fixed in a fixing device 9.
- short laser pulses 11 with a pulse duration of less than 1 ps and a wavelength in the UV range are directed onto the nucleic acids 6 with the bound proteins 5 using a laser 10.
- the laser pulses 11 have a pulse duration in the femtosecond range, so that the laser 10 is also referred to as a femtosecond laser.
- the laser pulses 11 cause cross-links 12 between the proteins 5 and the nucleic acids 6.
- the cross-links are based on the conversion of hydrogen bonds into covalent bonds and have a bond length of zero, meaning they bind the respective protein 5 directly to the respective nucleic acid 6.
- Quality control 27 ensures that only high-confidence reads 26, which are typically filtered based on Phred quality scores and read lengths, are retained for subsequent squiggle analysis 28.
- Squiggle analysis 28 for example, uses Remora, another open-source program from Oxford Nanopore Technologies, to identify variations that could correspond to altered bases or cross-linking events.
- Basecalling training 29 involves iterative refinement of the basecalling model used in basecalling 25, incorporating known modifications or experimental artifacts to improve the detection of DNA changes caused by cross-linking.
- the identified cross-linked DNA bases are then used in downstream analyses not separately shown here to infer specific peptide residues bound to these sites.
- the results of analysis 20 are the binding site of interest, 2 of protein 5 to nucleic acid 6, and the peptide residue 21 bound there.
- the analysis 20 of the squiggle signal 18 must be modified compared to these commercial products so that the binding sites 2 of interest of the bound amino acids 21 are determined.
- the analysis 20 or the basecalling model used can be trained using known combinations of binding sites and bound amino acids, as well as potential other DNA changes resulting from the laser pulses 11.
- the laser pulses 11 can cause damage to the nucleic acids 5 in the fixation device 9, such as strand breaks or the formation of pyrimidine dimers. However, this does not impede the sequencing 16 in the nanopore sequencing device 17. Radiation-induced molecular modifications of the DNA, such as pyrimidine dimers and hydrates, can be detected by base calling after the signal has been learned and assigned to the original bases.
- Fig. 3 shows quality scores of analyzed DNA libraries output by a commercial nanopore technology product.
- Fig. 3A shows the quality score for 200 bp double-stranded DNA fragments without UV irradiation (“(-)UVR”) as a comparison value on the left, and the corresponding quality score after UV irradiation (“(+)UVR”) on the right.
- Fig. 2B shows the quality scores of 200 bp double-stranded DNA fragments and transcription factors without cross-linking (“(-)DPC”) on the left, and with cross-linking (“(+)DPC”) on the right.
- the protein hydrolysis and purification steps of DNA fragments following UV irradiation and cross-linking, respectively, were performed in parallel for both sample types.
- the quality score of Fig. 3B, right, with an average of 9.8, is not significantly worse than the comparison value of Fig. 2A, left, with an average of 11.1.
- Fig. 4 shows quality control metrics for Nanopore sequencing data from additional analyzed DNA libraries consisting of two biological replicates, Buffer A and Buffer B, as well as three technical replicates each.
- Fig. 4A shows the distribution of read lengths of the sequenced DNA libraries from control samples (dsDNA only) and two independently cross-linked samples (dsDNA+TBP+FLIX in Buffer A and dsDNA+TBP+FLIX in Buffer B).
- the raw sequencing data were converted to sequence information using a canonical basecalling model, and only reads with a quality score (q-score) of 10 were included. or higher were selected for analysis.
- Figure 4B shows the Phred quality score distribution of the analyzed DNA libraries. The table below provides a statistical summary of the number of reads generated by Phred quality assessments and the average quality scores.
- Control 9,301 Control 404,249 — Control 839,238
- BufferA 12.4 BufferA 12.7 — BufferA 12.8
- Fig. 5 shows sequence information for a proof-of-concept study of the method according to the invention, in which the binding behavior of the TATA-box binding protein (TBP) to corresponding double-stranded target sequences was investigated.
- Fig. 5A shows i) the consensus sequence of the TATA-box motif (Seq_1) in reverse complementary orientation. Listed below are ii) the reference information for mapped cross-linking points (five-pointed empty stars) of TBP on short, double-stranded oligonucleotides (Seq_2) using MS (Reim et al.
- Fig. 5B shows the 200 bp dsDNA sequence (Seq_4) used for in vitro binding studies in combination with TBP. Two reference regions, Region #1 and Region #2, are indicated, which were used to analyze the squiggle signals outside the TATA box.
- Fig. 6 shows preliminary sequencing results of cross-linked interactions of TBP with double-stranded DNA and corresponding controls in the proof-of-concept study. The sequencing data were generated and analyzed using methods and equipment described in the previous figures.
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Zum Bestimmen von Bindungsplätzen (2) von Proteinen (5) an Nukleinsäuren (6) werden Bindungen der Proteine (5) an die Nukleinsäuren (6) durch kurze Laserpulse (11) mit einer Pulsdauer von nicht mehr als 100 ns fixiert. Die Nukleinsäuren (6) mit den fixierten Bindungen werden unter Hindurchführen durch Nanoporen sequenziert.
Description
VERFAHREN UND VORRICHTUNG ZUM BESTIMMEN VON BINDUNGSPLÄTZEN VON PROTEINEN AN NUKLEINSÄUREN, INSBESONDERE VON TRANSKRIPTIONSFAKTOREN AN DNS
TECHNISCHES GEBIET DER ERFINDUNG
Die Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zum Bestimmen von Bindungsplätzen von Proteinen an Nukleinsäuren. Im Fokus stehen Interaktionen von Transkriptionsfaktoren und DNS. Des Weiteren können durch die Erfindung vielfältige Wechselwirkungen von DNS-bindenden Proteinen mit der DNS untersucht werden. Genauer bezieht sich die Erfindung auf ein Verfahren mit den Merkmalen des Oberbegriffs des unabhängigen Patentanspruchs 1 und auf eine Vorrichtung zur Durchführung eines solchen Verfahrens.
STAND DER TECHNIK
Ein Verfahren mit den Merkmalen des Oberbegriffs des unabhängigen Patentanspruchs 1 ist aus Reim, A. et al. Atomic-resolution mapping of transcription factor-DNA interactions by femtosecond laser crosslinking and mass spectrometry, Nature Communications 11 , 3019; 10.1038/s41467- 020-16837-x, 2020, bekannt. Bindungen von Transkriptionsfaktoren an DNS werden bei diesem auch als FLIX-MS bezeichneten Verfahren mittels Quervernetzung durch Femtosekundenlaserpulse fixiert. Dabei werden Wasserstoffbrückenbindungen in kovalente Bindungen umgewandelt. Dann wird die DNS bis auf wenige Nukleotide abgebaut, und die Proteine werden gespalten. Nach Aufreinigung und Anreicherung der Peptid-Nukleotid-Quervernetzungsprodukte werden diese durch Massenspektrometrie analysiert, um Rückschlüsse auf die Bindungsplätze von DNA-Protein-Interaktionen zu ziehen. Die Bindungsplätze und angebundenen Peptide werden durch Computeralgorithmen errechnet. Insgesamt ist dieses Vorgehen vergleichsweise aufwändig.
Neben den gewünschten Quervernetzungen der zunächst kovalent an die DNS gebundenen Proteine treten durch die Einwirkung der Femtosekundenlaserpulse mit Wellenlängen im UV-
Bereich auch unerwünschte Veränderungen der DNS auf, siehe Russmann, C. et al. Crosslinking of progesterone receptor to DNA using tuneable nanosecond, picosecond and femtosecond UV laser pulses. Nucleic Acids Res. 1997 Jun 15; 25(12):2478-84, 10.1093/nar/25.12.2478. Hier muss unterschieden werden zwischen mono- und biophotonischen Schäden der DNS. Durch die hohen Intensitäten der Femtosekundenlaserpulse dominieren biphotonische Schäden wie Strangbrüche, die durch simultane Absorption zweier Photonen entstehen. Seltener entstehen monophotonische Schäden, wie Pyrimidin-Dimere. Diese Veränderungen sind bei dem FLIX-MS Verfahren aufgrund des sich sowieso anschließenden Abbaus der DNS jedoch unkritisch.
Die Nanoporen-Sequenzierung ist ein DNS-Sequenzierungsverfahren, das von der Oxford Nanopore Technologies PLC. kommerzialisiert wurde. Bei dieser Nanoporentechnologie fallen elektrische Signale an, die als Squiggle-Signale bezeichnet werden. Diese Rohsignale werden durch eine bioinformatische Methode, dem sogenannten Basecalling, den vier kanonischen Nukleotiden zugeordnet, wobei mit entsprechenden Basecalling-Modellen auch Modifikationen, wie z. B. DNS-Methylierungen, detektiert werden. Die beim Basecalling zur Anwendung kommenden Basecalling-Modelle wurden mit Hilfe bekannter DNS-Sequenzen angelernt.
Aus Valenzuela-Gömez, F. et al. Nanopore sensing reveals a preferential pathway for the co- translocational unfolding of a conjugative relaxase-DNA complex, Nucleic Acids Research, Vol. 51 , No. 13, 6357-6869, 10.1093/nar/gkad492, 2023, ist bekannt, dass eine Nanoporentechnologie, die in diesem Fall nicht von der Oxford Nanopore Technologies PLC. stammt, dazu genutzt werden kann, einen Protein-DNS-Komplex, der um ein Vielfaches größer ist als ein einzelner DNS-Strang, zu analysieren.
Aus Georgieva, D. et al. Detection of base analogs incorporated during DNA replication by nanopore sequencing, Nucleic Acids Research, Vol. 48, Ausgabe 15, September 4, 2020, Seite e88, 10.1093/nar/gkaa517 ist die Anwendung des Tools MinlON der Oxford Nanopore Technologies PLC. bekannt, um verschiedene Thymidin-Analoge, einschließlich CldU, BrdU, IdU sowie EdU, allein oder gekoppelt an Biotin und andere größere Addukte bei synthetischen DNS- Templaten zu detektieren.
AUFGABE DER ERFINDUNG
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung aufzuzeigen, die in der Lage sind, Bindungsplätze von Proteinen an DNS auf molekularer Ebene zu bestimmen.
Dazu sollen molekulare Bindungsplätze von DNS-bindenden Proteinen mit geringerem Aufwand und schneller als bislang direkt bestimmt werden können.
LÖSUNG
Die Aufgabe der Erfindung wird durch ein Verfahren mit den Merkmalen des unabhängigen Patentanspruchs 1 gelöst. Die abhängigen Patentansprüche 2 bis 8 beschreiben bevorzugte Ausführungsformen des erfindungsgemäßen Verfahrens. Der Patentanspruch 9 ist auf eine Vorrichtung zur Durchführung des erfindungsgemäßen Verfahrens gerichtet; und der Patentanspruch 10 betrifft eine bevorzugte Ausführungsform der erfindungsgemäßen Vorrichtung.
BESCHREIBUNG DER ERFINDUNG
Bei dem erfindungsgemäßen Verfahren zum Bestimmen von Bindungsplätzen von Proteinen an Nukleinsäuren werden Bindungen der Proteine an die Nukleinsäuren durch kurze Laserpulse mit einer Pulsdauer von nicht mehr als 100 ns fixiert, und die Nukleinsäuren mit den fixierten Bindungen werden unter Hindurchführen durch Nanoporen sequenziert.
Überraschenderweise kann kommerziell verfügbare Nanoporentechnologie, können aber auch selbst hergestellte und/oder anwendungsspezifisch gestaltete Nanoporen, z. B. basierend auf a- Hämolysin, erfolgreich verwendet werden, um die Nukleinsäuren trotz der durch die Laserpulse fixierten Bindungen und damit einhergehender unbeabsichtigter Veränderungen der Nukleinsäuren, wie beispielsweise Strangbrüche und Bildung von Pyrimidin-Dimeren, so zu sequenzieren, dass die Bindungsplätze der Proteine an die Nukleinsäuren bestimmt werden können. Die Erfindung kombiniert zwei leicht automatisierbare Verfahrensschritte ohne komplexe Probenaufbereitung zwischen dem Quervernetzen der Proteine an die Nukleinsäuren und dem Sequenzieren der Nukleinsäuren mit den fixierten Bindungen.
Mit den kurzen Laserpulsen werden die Bindungen der Proteine an die Nukleinsäuren bei isolierten Substanzen (z. B. rekombinante Proteine und Oligonukleotide oder Plasmid-DNA) oder unmittelbar in einer biologischen Kultur (z. B. Zellkultur, Gewebekultur, Organoide, Tumor- sphäroide) fixiert. In jedem Fall wird das gesamte erfindungsgemäße Verfahren jedoch außerhalb des menschlichen oder tierischen Körpers durchgeführt. Die kurzen Laserpulse mit der Pulsdauer von nicht mehr als 100 ns werden bei dem erfindungsgemäßen Verfahren so ausgebildet, dass sie Wasserstoffbrückenbindungen der Proteine an die Nukleinsäuren in kovalente Bindungen umwandeln, ohne dass zusätzliche Moleküle an der Bindung beteiligt werden. Die kurzen Laser-
pulse bewirken daher eine Quervernetzung direkt zwischen der Aminosäure und deren Bindungsplatzes an der Nukleinsäure, d. h. ein sogenanntes „zero length-crosslinking“. Besonders geeignete kurze Laserpulse weisen Pulslängen im Femtosekundenbereich bis Pikosekundenbereich auf, wobei Pulsdauern von weniger als 1 ps, d. h. so genannte Femtosekundenlaserpulse, bevorzugt sind, und Wellenlängen im UV-Bereich auf, wobei Laserpulse im UV-Bereich mit weiteren Laserpulsen auch größerer Wellenlänge in einem definierten zeitlichen Abstand kombiniert werden können, siehe Russmann, C. et al., Two wavelength femtosecond laser induced DNA-protein crosslinking. Nucleic Acid Research, 1998. Vorteilhaft ist hierbei eine signifikante Reduktion der oben beschriebenen DNS-Schäden. Auch die Verwendung von hochintensiven sichtbaren Pulsen ist möglich, z. B. bei einem Vielfachen der UV-Wellenlänge, siehe DE 10 2010 020 194 B4.
Zu weiteren möglichen Ausgestaltungen der kurzen Laserpulse finden sich Angaben in der Literatur zur sogenannten Femtosekundenlaser-induzierten DNS-Protein-Quervernetzung (femtosecond laser induced DNA-proteine crosslinking = FLIX). Hier sind auch die physikalischchemischen Grundlagen dieser Technologie beschrieben.
Bei den Nukleinsäuren, auf die sich das erfindungsgemäße Verfahren bezieht, handelt es sich insbesondere um DNS, wobei die betrachteten Proteine insbesondere Transkriptionsfaktoren sind. Die DNS, an die die Proteine anbinden, ist in der Regel Doppelstrang-DNS. Alternativ können die Nukleinsäuren Einzelstrang-DNS oder RNS sein, wobei eine entsprechende Anpassung der Probenaufbereitung vor der Anwendung Nanoporentechnologie erforderlich sein kann. Beim Sequenzieren von Doppelstrang-DNS durch Nanoporentechnologie wird die Doppel- strang-DNS in zwei Einzelstränge aufgeteilt, von denen dann jeweils ein zufällig ausgewählter durch die jeweilige Nanopore hindurchgeführt und dabei sequenziert wird. Dabei ist es grundsätzlich vorteilhaft, wenn beide Einzelstränge der Doppelstrang-DNS sequenziert werden. Wenn nur einer der beiden Stränge sequenziert wird, kann Information zu fixierten Bindungen verloren gehen. Durch sogenanntes Duplex-Basecalling können beide Stränge direkt nacheinander sequenziert werden und es liegen komplementäre Informationen vor.
Bei dem erfindungsgemäßen Verfahren können die Nukleinsäuren direkt nach der Fixierung der Bindungen der Proteine mit den angebundenen Proteinen mittels Nanoporentechnologie sequenziert werden. Dabei schlagen Proteine höheren Molekulargewichts, wie beispielsweise Transkriptionsfaktoren, an die Nanoporen an, das heißt, wenn die Proteine bis an den Eingang der Nanoporen gelangt sind, blockieren sie die jeweilige Nukleinsäure in der jeweiligen Nanopore.
Dadurch endet ein bei der Nanoporentechnologie anfallendes Squiggle-Signal an einem Punkt, der für den Bindungsplatz des jeweiligen Proteins an die jeweilige Nukleinsäure repräsentativ ist.
Vorzugsweise werden die Proteine bei dem erfindungsgemäßen Verfahren vor dem Sequenzieren der Nukleinsäuren soweit abgebaut, dass die Nukleinsäuren über die Bindungen hinweg durch die Nanoporen hindurchtreten können. Die dabei anfallenden Squiggle-Signale sind dann unmittelbar durch die Bindungen an bestimmte Nukleinbasen der Nukleinsäuren und die daran angebundenen Reste der Proteine beeinflusst. So kann aus den Squiggle-Signalen auf die Bindungsplätze und die angebundenen Reste rückgeschlossen werden.
Bei der Analyse von biologischen Kulturen kann in einer Ausführungsform - wenn konkrete Bindungsstellen eines bekannten Transkriptionsfaktors im Genom gesucht werden - eine Chromatin-Immunpräzipitation (ChIP) durchgeführt werden, siehe Orlando V., Mapping chromosomal proteins in vivo by formaldehyde-crosslinked-chromatin immunoprecipitation., Trends Biochem Sei. 2000, 25(3) pp. 99-104. Diese umfasst in diesem Fall die Quervernetzung mittels FLIX, die Lyse der Zellmembranen und Fragmentierung des Chromatins mittels Ultraschall und/oder Nukleasen in Stücke von einigen hundert Basenpaaren, die Immunpräzipitation und die nachfolgende Probenaufbereitung und Analyse mittels Nanoporensequenzierung.
Konkret können die Proteine vor dem Sequenzieren der Nukleinsäuren bis auf eine bis maximal zehn Aminosäuren, vorzugsweise auf eine bis maximal drei Aminosäuren und am meisten bevorzugt auf eine Aminosäure, nämlich diejenige mit der fixierten Bindung an die jeweilige Nukleinsäure abgebaut werden. Der insoweit vollständige Abbau des Proteins ist mit verschiedenen Proteasen problemlos möglich. Zudem stellt er eine problemlose Passage der Nukleinsäuren mit den angebundenen Resten der Proteine durch die Nanoporen sicher. Für diesen Zweck kann zum Beispiel Proteinase K verwendet werden. Diese Serinprotease hat ein weites Wirkungsspektrum. Sie hydrolysiert eine Vielzahl von Peptidbindungen, was zur Aufspaltung von Proteinen in kleinere Polypeptide und schließlich in einzelne Aminosäuren führt. Proteinase K wird üblicherweise für den Schritt der Proteolyse im Rahmen der DNS-Extraktion aus Gewebe oder Zellkulturproben eingesetzt.
An den Abbau der Proteine kann sich eine Aufreinigung der Nukleinsäuren mit den angebundenen Resten der Proteine von anderen Abbauprodukten anschließen. Qualitativ hochwertige und hochreine DNS ist wichtig für viele molekularbiologische Arbeiten. Es kann auf etablierte
Protokolle wie Phenol-Chloroform-Extraktion oder kommerziell erhältliche Kits zur DNS- Extraktion für Next Generation Sequencing zurückgegriffen werden.
Ein Analyseschritt während oder nach der DNS-Sequenzierung beinhaltet die Zuordnung von spezifischen Squiggle-Signalen zu den Bindungsplätzen von gebundenen Peptiden oder Proteinen - hier Nutzsignale - und die Abgrenzung zu den kanonischen Nukleotid-Signalen. Dieses sogenannte Basecalling bzw. ein dabei zur Anwendung kommendes sogenanntes Basecalling-Modell kann mit Hilfe von kontrolliert hegestellten Proben bekannter Nukleinsäure- Aminosäure-Wechselwirkungen und potentieller Störsignale von DNS-Schäden wie Pyrimidindimeren oder -hydraten, angelernt werden.
Das Anlernen des Basecalling umfasst Machine Learning oder Deep Learning Methoden. Der generierte Algorithmus ordnet den Nutzsignalen den Bindungsplatz in Form einer Nukleobase und die gebundene Aminosäure zu und den Störsignalen die ursprünglichen Nukleobasen, z. B. bei Pyrimidindimeren die einzelnen Thymine, zu.
Die originäre Bindung der Proteine an die Nukleinsäuren kann schon vor der Durchführung des erfindungsgemäßen Verfahrens gegeben sein. Die Nukleinsäuren können aber auch erst zu Beginn des erfindungsgemäßen Verfahrens mit einem oder mehreren Proteinen kontaktiert werden, um diese Proteine an die Nukleinsäuren zu binden.
Eine erfindungsgemäße Vorrichtung zur automatisierten Durchführung des erfindungsgemäßen Verfahrens umfasst eine Fixiereinrichtung, die einen Laserstrahlung in Form eines kurzen Laserpulses oder von Pulssequenzen mit einer Einzelpulsdauer von nicht mehr als 100 ns bereitstellenden Laser aufweist, um Bindungen von Proteinen an Nukleinsäuren bei isolierten Substanzen (z. B. rekombinante Proteine und Oligonukleotide oder Plasmid-DNA) oder direkt in biologischen Kulturen (z. B. Zellkultur, Gewebekultur, Organoide, Tumorsphäroide) zu fixieren, und eine Nanoporensequenziereinrichtung, wobei die Nanoporensequenziereinrichtung an die Fixiereinrichtung angeschlossen ist, um die Nukleinsäuren mit den fixierten Bindungen zu sequenzieren. Die Laserstrahlung kann die ganze Probe auf einmal bestrahlen, z. B. in einem Eppendorf-Tube oder einer Quarzküvette, abrastern, z. B. in einer Zellkulturschale oder einer Mikrotiterplatte, oder in einer mikrofluidischen Anlage beaufschlagen, siehe beispielsweise Nebbioso, A. et al, Time-resolved analysis of DNA-protein interactions in living cells by UV laser pulses. Sei Rep. 2017 Sep 15;7(1): 11725. doi: 10.1038/s41598-017-12010-5.
Zwischen die Fixiereinrichtung und die Nanoporensequenziereinrichtung kann eine Probenverarbeitungseinrichtung geschaltet sein, die konfiguriert ist, um die angebundenen Proteine bis auf eine bis maximal zehn Aminosäuren, vorzugsweise bis auf eine bis maximal drei und am meisten bevorzugt bis auf eine einzelne an die jeweilige Nukleinsäure angebundene Aminosäure abzubauen. Auch in komplexere Proben wie Zellen oder Gewebe kann damit der Abbau der Proteine umgesetzt werden. Zwischen der Fixiereinrichtung und der Nanoporensequenziereinrichtung werden die Nukleinsäuren jedoch nicht aufgeschlossen, fragmentiert oder anderweitig abgebaut. Vielmehr werden die Nukleinsäuren insbesondere in Form von Doppelstrang-DNS zwar in einer für die Nanoporentechnologie üblichen Weise aufgereinigt, aber ansonsten direkt der Nanoporensequenziereinrichtung zugeführt. Bei der Nanoporensequenziereinrichtung kann es sich insbesondere um eine kommerziell verfügbare Nanoporensequenziereinrichtung handeln, die eigentlich zum Sequenzieren von DNS ohne angebundene Proteine oder Peptide ausgebildet ist.
Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den Patentansprüchen, der Beschreibung und den Zeichnungen.
Die in der Beschreibung genannten Vorteile von Merkmalen und von Kombinationen mehrerer Merkmale sind lediglich beispielhaft und können alternativ oder kumulativ zur Wirkung kommen, ohne dass die Vorteile zwingend von erfindungsgemäßen Ausführungsformen erzielt werden müssen.
Hinsichtlich des Offenbarungsgehalts - nicht des Schutzbereichs - der ursprünglichen Anmeldungsunterlagen und des Patents gilt Folgendes: Weitere Merkmale sind den Zeichnungen - insbesondere den dargestellten Geometrien und den relativen Abmessungen mehrerer Bauteile zueinander sowie deren relativer Anordnung und Wirkverbindung - zu entnehmen. Die Kombination von Merkmalen unterschiedlicher Ausführungsformen der Erfindung oder von Merkmalen unterschiedlicher Patentansprüche ist ebenfalls abweichend von den gewählten Rückbeziehungen der Patentansprüche möglich und wird hiermit angeregt. Dies betrifft auch solche Merkmale, die in separaten Zeichnungen dargestellt sind oder bei deren Beschreibung genannt werden. Diese Merkmale können auch mit Merkmalen unterschiedlicher Patentansprüche kombiniert werden. Ebenso können in den Patentansprüchen aufgeführte Merkmale für weitere Ausführungsformen der Erfindung entfallen, was aber nicht für die unabhängigen Patentansprüche des erteilten Patents gilt.
Die in den Patentansprüchen und der Beschreibung genannten Merkmale sind bezüglich ihrer Anzahl so zu verstehen, dass genau diese Anzahl oder eine größere Anzahl als die genannte Anzahl vorhanden ist, ohne dass es einer expliziten Verwendung des Adverbs "mindestens" bedarf. Wenn also beispielsweise von einer Protease die Rede ist, ist dies so zu verstehen, dass genau eine Protease, zwei Proteasen oder mehr Proteasen eingesetzt werden. Die in den Patentansprüchen angeführten Merkmale können durch weitere Merkmale ergänzt werden oder die einzigen Merkmale sein, die der Gegenstand des jeweiligen Patentanspruchs aufweist.
Die in den Patentansprüchen enthaltenen Bezugszeichen stellen keine Beschränkung des Umfangs der durch die Patentansprüche geschützten Gegenstände dar. Sie dienen lediglich dem Zweck, die Patentansprüche leichter verständlich zu machen.
KURZBESCHREIBUNG DER FIGUREN
Im Folgenden wird die Erfindung anhand in den Figuren dargestellter bevorzugter Ausführungsbeispiele weiter erläutert und beschrieben.
Fig. 1 ist ein Ablaufdiagramm von Schritten einer Ausführungsform des erfindungsgemäßen Verfahrens und illustriert zugleich den Aufbau einer erfindungsgemäßen Vorrichtung.
Fig. 2 ist ein Ablaufdiagramm von an die Schritte gemäß Fig. 1 anschließende Analyseschritte einer Ausführungsform des erfindungsgemäßen Verfahrens.
Fig. 3A und B zeigen Quality Scores von analysierten DNS-Bibliotheken, wie sie bei dem erfindungsgemäßen Verfahren, Fig. 3B, rechts, und bei Vergleichsversuchen, Fig. 3A und Fig. 3B, links, auftreten.
Fig. 4A und B zeigen Metriken zur Qualitätskontrolle von Nanopore-Sequenzierungsdaten von weiteren analysierten DNS-Bibliotheken bestehend aus zwei biologischen Replikaten, Puffer A und Puffer B sowie je drei technischen Replikaten.
Fig. 5A und B zeigen Sequenzinformationen zu einer proof-of-concept Studie zu dem erfindungsgemäßen Verfahren.
Fig. 6A, B, C und D zeigen vorläufige Sequenzierungsergebnisse quervernetzter Interaktionen von TBP mit doppelsträngiger DNS und entsprechende Kontrollen bei der proof- of-concept Studie.
FIGURENBESCHREIBUNG
Das in Fig. 1 in Form eines Ablaufdiagramms dargestellte erfindungsgemäße Verfahren 1 dient zur Bestimmung von Bindungsplätzen von Transkriptionsfaktoren 3 an DNS 4. Das erfindungsgemäße Verfahren 1 kann auch zur Bestimmung der Bindungsplätze 3 anderer Proteine 5 an andere Nukleinsäuren 6 durchgeführt werden. In einem Bindungsreaktor 7 einer Vorrichtung 22 zur Durchführung des Verfahrens 1 wird das jeweilige Protein 5 mit der Nukleinsäure 6 kontaktiert, um eine Bindungsreaktion 8 zu ermöglichen. Bei dieser Bindungsreaktion bilden sich zwischen dem Protein 5 und der Nukleinsäure 6 typischerweise Wasserstoffbrückenbindungen aus, die für die Bestimmung der Bindungsplätze 2 nicht ausreichend stabil sind. Daher werden die Bindungen in einer Fixiereinrichtung 9 fixiert. Dazu werden mit einem Laser 10 kurze Laserpulse 11 einer Pulsdauer von hier weniger als 1 ps und einer Wellenlänge im UV-Bereich auf die Nukleinsäuren 6 mit den angebundenen Proteinen 5 gerichtet. Vorzugsweise weisen die Laserpulse 11 eine Pulsdauer im Femtosekundenbereich auf, sodass der Laser 10 auch als Femtosekundenlaser bezeichnet wird. Die Laserpulse 11 bewirken Quervernetzungen 12 der Proteine 5 mit den Nukleinsäuren 6. Die Quervernetzungen basieren auf Umwandlungen der Wasserstoffbrückenbindungen in kovalente Bindungen und weisen eine Bindungslänge von null auf, das heißt sie binden das jeweilige Protein 5 unmittelbar an die jeweilige Nukleinsäure 6 an.
Anschließend erfolgt in einer Probenverarbeitungseinrichtung 13 unter Verwendung einer Protease 14 ein Abbau der Proteine 5 bis auf die jeweils unmittelbar an die jeweilige Nukleinsäure 6 angebundene Aminosäure 21. Hieran wird sich in der Regel eine Aufreinigung der Nukleinsäuren 6 von Abbauprodukten der Proteine anschließen, zum Beispiel unter Verwendung kommerzieller Kits der Oxford Nanopore PLC. Es folgt eine Sequenzierung 16 der Nukleinsäuren 6 mit der angebundenen Aminosäure in einer Nanoporensequenziereinrichtung 17. Dabei fallen Rohdaten 23 in Form eines sogenanntes Squiggle-Signals 18 an.
Gemäß Fig. 2 werden die Rohdaten 23 von der Sequenzierung 16, d. h. das Squiggle-Signal 18, das üblicherweise im FAST5- oder POD5-Format vorliegt, in einer Analyseeinrichtung 19 einer Analyse 20 unterworfen. Dazu wird das Squiggle-Signal 18 einem sogenannten Basecalling 25 beispielsweise mit Hilfe des Basecallers Dorado, einem Open Source Programm von Oxford
Nanopore Technologies, unterzogen. Die Genauigkeit des Basecalling 25 hängt von dem verwendeten Basecalling-Modell ab, das in der Regel auf unveränderte DNS trainiert ist, aber angepasst werden kann, um die Erkennung von Modifikationen zu verbessern. Die Ergebnisse des Basecallings 25, die als Reads 26 bezeichnet werden, werden einer Qualitätskontrolle 27 unterzogen. Durch die Qualitätskontrolle 27 wird sichergestellt, dass nur Reads 26 mit hoher Zuverlässigkeit, die in der Regel auf der Grundlage von Phred-Qualitätsbewertungen und Leselängen gefiltert werden, für eine nachfolgende Squiggle-Analyse 28 beibehalten werden. Bei der Squiggle-Analyse 28 werden beispielsweise mit Hilfe von Remora, einem weiteren Open Source Programm von Oxford Nanopore Technologies, Abweichungen identifiziert, die veränderten Basen oder Quervernetzungsereignissen entsprechen könnten. Bei einem Basecalling-Training 29 erfolgt eine iterative Verfeinerung des Basecalling-Modells, das bei dem Basecalling 25 zur Anwendung kommt, wobei bekannte Modifikationen oder experimentelle Artefakte einbezogen werden, um die Erkennung von durch Quervernetzung verursachten DNS- Veränderungen zu verbessern. Die identifizierten vernetzten DNS-Basen werden dann in hier nicht separat dargestellten nachgeschalteten Analysen verwendet, um einen Rückschluss auf spezifische Peptidreste zu ziehen, die an diesen Stellen angebunden sind. Als Ergebnisse der Analyse 20 werden der interessierende Bindungsplatz 2 des Proteins 5 an die Nukleinsäure 6 und der dort angebundene Peptidrest 21 erhalten.
In einer Variante des Verfahrens 1 wird auf den Abbau 15 des Proteins 5 verzichtet. Dann endet die Sequenzierung 16 in der Nanoporensequenziereinrichtung 17 immer dann, wenn das angebundene Protein 5 an den Eingang der jeweiligen Nanopore anschlägt und ein weiteres Hindurchtreten der Nukleinsäure 6 beziehungsweise des jeweiligen Strangs der Nukleinsäure 6 durch die jeweilige Nanopore verhindert. Bei Kenntnis der Sequenz der Nukleinsäure 6 gibt das damit eintretende Ende des jeweiligen Squiggle-Signals 18 einen Hinweis auf den interessierenden Bindungsplatz 2. Der gebundene Peptidrest 21 lässt sich so jedoch nicht ermitteln.
Die Quervernetzung 12 in der Fixiereinrichtung 9 mit Hilfe der kurzen Laserpulse 11 erfolgt gemäß der bekannten FLIX-Technologie, beispielsweise genauso wie bei der sogenannten FLIX-MS- Technologie, bei der sich an die Quervernetzung nicht nur ein Abbau 15 des Proteins 5, sondern auch ein Abbau der Nukleinsäure 6 und dann eine Aufreinigung der an die Nukleinsäurereste gebundenen Proteinreste sowie eine Massenspektrometrie dieser Bindungsprodukte anschließen.
Die Sequenzierung 16 der Nukleinsäuren 6 in der Nanoporensequenziereinrichtung 17 kann ohne aufwändige vorherige Aufbereitung mit kommerziell verfügbaren Produkten, eigenen oder kundenspezifisch-hergestellten Nanoporen erfolgen. Die Analyse 20 des Squiggle-Signals 18 ist jedoch gegenüber diesen kommerziellen Produkten so zu modifizieren, dass die interessierenden Bindungsplätze 2 der gebundenen Aminosäuren 21 bestimmt werden. Hierzu kann die Analyse 20 bzw. das dabei zur Anwendung kommende Basecalling-Modell mit Hilfe bekannter Kombinationen von Bindungsplätzen und gebundenen Aminosäuren sowie potentieller anderer DNS-Veränderungen in Folge der Laserpulse 11 angelernt werden.
Durch die Laserpulse 11 können in der Fixiereinrichtung 9 Schäden an den Nukleinsäuren 5 hervorgerufen werden, wie beispielsweise Strangbrüche oder eine Bildung von Pyrimidin- Dimeren. Hierdurch wird die Sequenzierung 16 in der Nanoporensequenziereinrichtung 17 jedoch nicht behindert. Strahlen-induzierte molekulare Modifikationen der DNS, wie Pyrimidindimere und -hydrate, können nach Anlernen des Signals durch das Basecalling erkannt und den ursprünglichen Basen zugeordnet werden.
Fig. 3 zeigt von einem kommerziellen Produkt der Nanoporentechnologie ausgegebene Qualitätswerte ("Quality Scores") von analysierten DNS-Bibliotheken. Fig. 3A zeigt links den Quality Score für Doppelstrang-DNS-Fragmente einer Länge von 200 bp ohne UV-Bestrahlung, "(-)UVR", als Vergleichswert und rechts den entsprechenden Quality Score nach UV-Bestrahlung, "(+)UVR". Fig. 2B zeigt die Quality Scores von Doppelstrang-DNS-Fragmenten von 200 bp Länge und Transkriptionsfaktor links ohne Quervernetzung, "(-)DPC", und rechts mit Quervernetzung, "(+)DPC". Die sich an die UV-Bestrahlung bzw. die Quervernetzung anschließenden Proteinhydrolyse- und Aufreinigungsschritte von DNS-Fragmenten wurden bei beiden Probenarten parallel durchgeführt. Der Quality Score von Fig. 3B, rechts, ist mit einem Durchschnitt von 9,8 nicht wesentlich schlechter als der Vergleichswert von Fig. 2A, links, mit einem Durchschnitt von 11 ,1.
Fig. 4 zeigt Metriken zur Qualitätskontrolle von Nanopore-Sequenzierungsdaten weiterer analysierter DNS-Bibliotheken bestehend aus zwei biologischen Replikaten, Puffer A und Puffer B sowie je drei technischen Replikaten. Fig. 4A zeigt die Verteilung der Read-Längen der sequenzierten DNS-Bibliotheken aus Kontrollproben (nur dsDNS), und zwei unabhängig quervernetzten Proben (dsDNS+TBP+FLIX in Puffer A und dsDNS+TBP+FLIX in Puffer B). Die Sequenzierungsrohdaten wurden mithilfe eines kanonischen Basecalling-Modells in Sequenzinformationen umgewandelt und nur Reads mit einem Qualitätsscore (q-score) von 10
oder höher wurden für die Analyse ausgewählt. Fig. 4B zeigt die Phred Quality Score Verteilung der analysierten DNA-Bibliotheken. Die nachstehende Tabelle ist eine statistische Zusammenfassung der Anzahl der generierten Reads nach Phred-Qualitätsbewertungen und die durchschnittlichen Quality Scores.
Anzahl der reads nach Qualitätsfilterung
— Kontrolle 9.301 — Kontrolle 404.249 — Kontrolle 839.238
— PufferA 25.722 — PufferA 304.667 — PufferA 467.703
— - PufferB 13.073 — - PufferB 110.819 — - PufferB 442.953
Durchschnittliche Quality Scores
— Kontrolle 17,5 — Kontrolle 20,5 — ■ Kontrolle 20,6
— PufferA 12,4 — PufferA 12,7 — PufferA 12,8
■— PufferB 12,2 — - PufferB 12,7 ■— PufferB 12,9
Während die durchschnittlichen Quality Scores der Kontrolldatensätze höher sind als die der vernetzten Datensätze, erfüllen alle Datensätze den Standardschwellenwert für Nanopore- Sequenzierungs-Daten von guter Qualität (q-score >10). Die niedrigeren Qualitätswerte in den vernetzten Proben können auf durch Quervernetzung induzierte DNA-Modifikationen zurückzuführen sein, die vom kanonischen Basecalling nicht erkannt werden.
Fig. 5 zeigt Sequenzinformationen zu einer proof-of-concept Studie zu dem erfindungsgemäßen Verfahren, bei der das Bindeverhalten des TATA-Box binding Proteins (TBP) an entsprechende doppelsträngige Zielsequenzen untersucht wurde. Fig. 5A zeigt i) die Konsensussequenz des TATA-Box Motivs (Seq_1) in revers komplementärer Orientierung. Darunter sind aufgelistet ii) die Referenzinformation zu kartierten Quervernetzungspunkten (fünfzackige leere Sterne) von TBP an kurzen, doppelsträngigen Oligonukleotiden (Seq_2) mittels MS (Reim et al. 2020) und iii) einen Ausschnitt aus der EF1A Promotorregion (Seq_3) mit dem in der proof-of-concept Studie verwendeten TATA-Box Motiv und den erwarteten (fünfzackige Sterne mit Fragezeichen) Quervernetzungspunkten von TBP. Fig. 5B zeigt die 200 bp lange dsDNS-Sequenz (Seq_4) die für die in vitro Bindestudien in Kombination mit TBP verwendetet wurde. Es sind zwei Referenzregionen, Region#1 und Region#2, gekennzeichnet, die zur Analyse der Squiggle- Signale außerhalb der TATA-Box verwendet wurden.
Fig. 6 zeigt vorläufige Sequenzierungsergebnisse quervernetzter Interaktionen von TBP mit doppelsträngiger DNA und entsprechende Kontrollen bei der proof-of-concept Studie. Die Sequenzierungsdaten wurden mit anhand der vorhergehenden Figuren beschriebenen Verfahren und Vorrichtungen generiert und ausgewertet. Für diese Analyse wurden die Rohdaten 23 von Kontroll- und quervernetzten Proben einem kanonischen Basecalling 25 unter Verwendung eines auf nicht modifizierter DNS trainierten Modells unterzogen. Fig. 6 vergleicht repräsentative Nanopore-Signalverläufe von 50 unterabgetasteten Reads (n=3) zwischen Kontroll- (dsDNS, kein TBP, keine Vernetzung; „Ctrl“, schwarz) und quervernetzten Proben relativ zur TATA-Box. Fig. 6A: dsDNS, TBP, FLIX („FLIX - Puffer A“, grau); Fig. 6C: dsDNS, TBP, FLIX („FLIX - Puffer B“, grau). Fig. 6B und Fig. 6D zeigen zufällig ausgewählte, größenmäßig übereinstimmende Sequenzregionen der gleichen 200 bp Fragmente außerhalb des TBP-Bindungsmotivs. Die obere Hälfte jeder Übersichtsdarstellung zeigt strangspezifische Signale für Reads in 5' - 3'-Richtung, während die untere Hälfte die Signale in 3' - 5'-Richtung darstellt. Für jeden Strang zeigt das obere Diagramm die Squiggle-Signale, während das untere Diagramm die entsprechenden Standardabweichungen zeigt, um die Variabilität der Signale zu veranschaulichen. Die Sequenzbereiche sind an der Region von Interesse ausgerichtet (Fig. 6A und Fig. 6C: TATABOX; Fig. 6B und Fig. 6D: vergleichbare Regionen außerhalb des Bindungsmotivs). Die Quervernetzungs-Analyse an DNS-Basen von Interesse ist illustriert. Die erwarteten Quervernetzungspunkte (siehe Fig.3) sind durch diagonale Linien markiert; erfasste Veränderungen im Squiggle-Signal sind durch horizontale Linien markiert; wenn sich die erwarteten und beobachteten Stellen überschneiden, ist die Stelle mit vertikalen Linien ausgefüllt.
Erste Analysen mit kanonischem Basecalling und Squiggle-Analyse des TATA-Box-Motivs zeigen Signalabweichungen in vernetzten Proben im Vergleich zu Kontrollen, was auf veränderte Basen und potenzielle Bindungsstellen hindeutet. Während die Signalmuster außerhalb des TBP- Bindungsmotivs (Fig. 6B, Fig.6D) zwischen den Bedingungen auf beiden Strängen vergleichbar erscheinen, werden deutliche Abweichungen innerhalb des TBP-Bindungsmotivs (Fig. 6A, Fig. 6C) beobachtet - insbesondere an Cytosin und Adenin - sowie an einem Adenin, das sich stromaufwärts (5') der TATA-Box auf dem 5'-3'-Strang befindet. Außerhalb des TBP- Bindungsmotivs bleiben die Signalmuster weitgehend homogen. Vereinzelte Abweichungen treten jedoch sowohl in den Kontroll- als auch in den Vernetzungsdatensätzen auf. Im Gegensatz zu Abweichungen an den erwarteten Vernetzungsstellen (Fig. 6A, Fig. 6C) bilden diese keine Plateaus, die auf Basenmodifikationen hindeuten, und können auf Faktoren wie repetitive Sequenzen zurückzuführen sein.
BEZUGSZEICHENLISTE
Verfahren
Bindungsplatz
T ranskriptionsfaktor
DNS
Protein
Nukleinsäure
Bindungsreaktor
Bindungsreaktion
Fixiereinrichtung
Laser
Laserpuls
Quervernetzung
Probenverarbeitungseinrichtung
Protease
Abbau des Proteins
Sequenzierung
Nanoporensequenziereinrichtung
Squiggle-Signal
Analyseeinrichtung
Analyse
Gebundenes Peptid
Vorrichtung
Rohdaten
Computerdateien
Basecalling
Read
Qualitätskontrolle
Squiggle-Analyse
Basecalling-T raining
Claims
1. Verfahren (1) zum Bestimmen von Bindungsplätzen (2) von Proteinen (5) an Nukleinsäuren (6), wobei Bindungen der Proteine (5) an die Nukleinsäuren (6) durch kurze Laserpulse (11) mit einer Pulsdauer von nicht mehr als 100 ns fixiert werden, dadurch gekennzeichnet, dass die Nukleinsäuren (6) mit den fixierten Bindungen unter Hindurchführen durch Nanoporen sequenziert werden.
2. Verfahren (1) nach Anspruch 1, dadurch gekennzeichnet, dass die kurzen Laserpulse derart ausgebildet werden, dass Wasserstoffbrückenbindungen der Proteine (5) an die Nukleinsäuren (6) in kovalente Bindungen umgewandelt werden.
3. Verfahren (1) nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Proteine (5) vor dem Sequenzieren der Nukleinsäuren (6) soweit abgebaut werden, dass die Nukleinsäuren (6) über die Bindungen hinweg durch die Nanoporen hindurchtreten.
4. Verfahren (1) nach Anspruch 3, dadurch gekennzeichnet, dass die Proteine (5) jeweils bis auf eine bis maximal zehn Aminosäuren, vorzugsweise bis auf eine bis maximal drei und am meisten bevorzugt bis auf eine einzelne Aminosäure abgebaut werden.
5. Verfahren (1) nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass die Proteine (5) mit Hilfe einer Protease (14) abgebaut werden.
6. Verfahren (1) nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet, dass beim Hindurchführen der Nukleinsäuren (6) durch die Nanoporen anfallende Squiggle-Signale (18) analysiert werden, um die Aminosäure und eine Nukleobase, an die die Aminosäure kovalent gebunden ist und, optional, DNS-Schäden, zu bestimmen.
7. Verfahren (1) nach Anspruch 6, dadurch gekennzeichnet, dass ein Basecalling-Modell zum Erkennen des Restes und der Nukleinbase angelernt wird.
8. Verfahren (1) nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Nukleinsäuren (6) mit den angebundenen Proteinen (5) sequenziert werden, bis die Proteine (6) an die Nanoporen anschlagen.
9. Vorrichtung (22) zur automatisierten Durchführung des Verfahrens (1) nach einem der vorhergehenden Ansprüche, mit einer Fixiereinrichtung (9), die kurze Laserpulse (11) einer Pulsdauer von nicht mehr als 100 ns abgebenden Laser (10) aufweist, um Bindungen von Proteinen (5) an Nukleinsäuren (6) zu fixieren, und mit einer Nanoporensequenziereinrichtung, wobei die Nanoporensequenziereinrichtung (17) an die Fixiereinrichtung (9) angeschlossen ist, um die Nukleinsäuren (6) mit den fixierten Bindungen zu sequenzieren.
10. Vorrichtung (22) nach Anspruch 9, dadurch gekennzeichnet, dass zwischen die Fixiereinrichtung (9) und die Nanoporensequenziereinrichtung (17) eine Probenverarbeitungseinrichtung (13) geschaltet ist, die konfiguriert ist, um die angebundenen Proteine (5) bis auf eine bis maximal zehn Aminosäuren, vorzugsweise bis auf eine bis maximal drei und am meisten bevorzugt bis auf eine einzelne an die jeweilige Nukleinsäure (6) angebundene Aminosäure abzubauen.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024104997 | 2024-02-22 | ||
| DE102024104997.9 | 2024-02-22 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025176862A1 true WO2025176862A1 (de) | 2025-08-28 |
Family
ID=94824324
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/EP2025/054757 Pending WO2025176862A1 (de) | 2024-02-22 | 2025-02-21 | Verfahren und vorrichtung zum bestimmen von bindungsplätzen von proteinen an nukleinsäuren, insbesondere von transkriptionsfaktoren an dns |
Country Status (1)
| Country | Link |
|---|---|
| WO (1) | WO2025176862A1 (de) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014052433A2 (en) * | 2012-09-26 | 2014-04-03 | Nabsys, Inc. | Method and system for analysis of protein and other modifications on dna and rna |
| WO2015138405A2 (en) * | 2014-03-10 | 2015-09-17 | The Board Of Trustees Of The University Of Illinois | Detection and quantification of methylation in dna |
| WO2017104398A1 (ja) * | 2015-12-17 | 2017-06-22 | 株式会社日立ハイテクノロジーズ | 生体分子測定装置 |
| EP3404113A1 (de) * | 2017-05-19 | 2018-11-21 | Universidad del Pais Vasco | Verfahren zur detektion von protein-dna-interaktion |
| DE102010020194B4 (de) | 2010-05-07 | 2022-09-08 | Carl Zeiss Meditec Ag | Vorrichtung zur Stabilisierung der Augenhornhaut |
-
2025
- 2025-02-21 WO PCT/EP2025/054757 patent/WO2025176862A1/de active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102010020194B4 (de) | 2010-05-07 | 2022-09-08 | Carl Zeiss Meditec Ag | Vorrichtung zur Stabilisierung der Augenhornhaut |
| WO2014052433A2 (en) * | 2012-09-26 | 2014-04-03 | Nabsys, Inc. | Method and system for analysis of protein and other modifications on dna and rna |
| WO2015138405A2 (en) * | 2014-03-10 | 2015-09-17 | The Board Of Trustees Of The University Of Illinois | Detection and quantification of methylation in dna |
| WO2017104398A1 (ja) * | 2015-12-17 | 2017-06-22 | 株式会社日立ハイテクノロジーズ | 生体分子測定装置 |
| EP3404113A1 (de) * | 2017-05-19 | 2018-11-21 | Universidad del Pais Vasco | Verfahren zur detektion von protein-dna-interaktion |
Non-Patent Citations (11)
| Title |
|---|
| "Methods in Enzymology", vol. 582, 1 January 2017, ELSEVIER, ACADEMIC PRESS, NL, ISBN: 978-0-12-805382-9, article A.H. SQUIRES ET AL: "Single-Molecule Characterization of DNA-Protein Interactions Using Nanopore Biosensors", pages: 353 - 385, XP055394114, DOI: 10.1016/bs.mie.2016.08.010 * |
| GEORGIEVA, D. ET AL.: "Detection of base analogs incorporated during DNA replication by nanopore sequencing", NUCLEIC ACIDS RESEARCH, vol. 48, 4 September 2020 (2020-09-04), pages e88, XP055861275, DOI: 10.1093/nar/gkaa517 |
| JIWOOK SHIM ET AL: "Detection and Quantification of Methylation in DNA using Solid-State Nanopores", SCIENTIFIC REPORTS, vol. 3, 11 March 2013 (2013-03-11), XP055101649, DOI: 10.1038/srep01389 * |
| MOSS T ET AL: "UV-Laser Crosslinking of Proteins to DNA", METHODS, ACADEMIC PRESS, NL, vol. 11, no. 2, 1 February 1997 (1997-02-01), pages 225 - 234, XP004466478, ISSN: 1046-2023, DOI: 10.1006/METH.1996.0409 * |
| NAISH MATTHEW ET AL: "Supplementary materials The genetic and epigenetic landscape of the Arabidopsis centromeres", SCIENCE - AUTHOR MANUSCRIPT, vol. 374, no. 6569, 12 November 2021 (2021-11-12), US, XP093277105, ISSN: 0036-8075, Retrieved from the Internet <URL:https://pmc.ncbi.nlm.nih.gov/articles/instance/10164409/bin/NIHMS1895551-supplement-supplementary_materials_and_methods.pdf> DOI: 10.1126/science.abi7489 * |
| NEBBIOSO, A. ET AL.: "Time-resolved analysis of DNA-protein interactions in living cells by UV laser pulses", SCI REP., vol. 7, no. 1, 15 September 2017 (2017-09-15), pages 11725 |
| ORLANDO V.: "Mapping chromosomal proteins in vivo by formaldehyde-crosslinked-chromatin immunoprecipitation.", TRENDS BIOCHEM SCI., vol. 25, no. 3, 2000, pages 99 - 104, XP004202537, DOI: 10.1016/S0968-0004(99)01535-2 |
| REIM, A. ET AL.: "Atomic-resolution mapping of transcription factor-DNA interactions by femtosecond laser crosslinking and mass spectrometry", NATURE COMMUNICATIONS, vol. 11, 2020, pages 3019 |
| RUSSMANN, C. ET AL.: "Crosslinking of progesterone receptor to DNA using tuneable nanosecond, picosecond and femtosecond UV laser pulses", NUCLEIC ACIDS RES., vol. 25, no. 12, 15 June 1997 (1997-06-15), pages 2478 - 84 |
| RUSSMANN, C. ET AL.: "Two wavelength femtosecond laser induced DNA-protein crosslinking", NUCLEIC ACID RESEARCH, 1998 |
| VALENZUELA-GÖMEZ, F. ET AL.: "Nanopore sensing reveals a preferential pathway for the cotranslocational unfolding of a conjugative relaxase-DNA complex", NUCLEIC ACIDS RESEARCH, vol. 51, no. 13, 2023, pages 6357 - 6869 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69233719T2 (de) | Primer, Sätze und Restriktionsfragmente und deren Benutzung in selektiver Restriktionsfragmentenamplifikation | |
| DE69105959T2 (de) | Verfahren zur unterscheidung von nukleinsäuren auf basis von nukleotidverschiedenheiten. | |
| DE60025850T2 (de) | Verfahren zur erzeugung von oligonukleotiden, im besonderen zur detektion amplifizierter restriktionsfragmente, die durch aflp erhalten wurden | |
| DE69828517T2 (de) | Methode zur dns-isolierung. | |
| DE60312875T2 (de) | Genomteilung | |
| EP1034309A2 (de) | Verfahren zur herstellung komplexer dna-methylierungs-fingerabdrücke | |
| DE60213803T2 (de) | Happier mapping | |
| WO2006089762A1 (de) | Verfahren zur typisierung eines individuums mittels short tandem repeat (str)-loci der genomischen dna | |
| DE112010004821T5 (de) | Prozessierung amplifizierter DNA-Fragmente zur Sequenzierung | |
| DE102008061772A1 (de) | Verfahren zur Untersuchung von Nukleinsäure-Populationen | |
| DE60014067T2 (de) | Zusammensetzungen und verfahren zur genetischen analyse | |
| DD298430A5 (de) | Verfahren zum nachweis und/oder zur identifizierung einer nucleinsaeuresequenz | |
| DE69422467T2 (de) | Fraktioniermethode für Nukleotidfragmente | |
| DE102017002092A1 (de) | Verfahren zur Detektion von bekannten Nukleotid-Modifikationen in einer RNA | |
| DE3901675A1 (de) | Reinigung polymorpher komponenten komplexer genome | |
| WO2025176862A1 (de) | Verfahren und vorrichtung zum bestimmen von bindungsplätzen von proteinen an nukleinsäuren, insbesondere von transkriptionsfaktoren an dns | |
| DE69534386T2 (de) | Freigabe von intrazellulärem material | |
| WO2001027317A2 (de) | Verfahren zur unterscheidung von 5-position methylierungsänderungen | |
| EP1537246B1 (de) | Verfahren zur Amplifikation genetischer Information mittels an mehrere Stellen im Genom bindende Primer | |
| EP1960537A1 (de) | Verfahren zur bestimmung des genotyps aus einer biologischen probe enthaltend nukleinsäuren unterschiedlicher individuen | |
| EP2130918A1 (de) | Verfahren zur Erzeugung einer Varianten-Bibliothek von DNA-Sequenzen | |
| DE102007051578B3 (de) | Verfahren zur parallelen Amplifikation von wenigstens zwei verschiedenen Nukleinsäureabschnitten | |
| EP1272674A2 (de) | Verfahren zur identifizierung und isolierung von genomfragmenten mit kopplungsungleichgewicht | |
| DE69105897T2 (de) | Verfahren zur schnellen Sequenzierung von linearen und geordneten, biologischen Sequenzen. | |
| DE19957320A1 (de) | Dynamische Sequenzierung durch Hybridisierung |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 25708693 Country of ref document: EP Kind code of ref document: A1 |