[go: up one dir, main page]

TW202438678A - 單分子股特異性之末端形態 - Google Patents

單分子股特異性之末端形態 Download PDF

Info

Publication number
TW202438678A
TW202438678A TW113106609A TW113106609A TW202438678A TW 202438678 A TW202438678 A TW 202438678A TW 113106609 A TW113106609 A TW 113106609A TW 113106609 A TW113106609 A TW 113106609A TW 202438678 A TW202438678 A TW 202438678A
Authority
TW
Taiwan
Prior art keywords
nucleic acid
strand
acid molecule
acid molecules
sequence
Prior art date
Application number
TW113106609A
Other languages
English (en)
Inventor
煜明 盧
君賜 陳
江培勇
周晴
劉靜
彭文磊
Original Assignee
創新診斷科技中心
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 創新診斷科技中心 filed Critical 創新診斷科技中心
Publication of TW202438678A publication Critical patent/TW202438678A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/319Exonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

雙股游離DNA片段之一端或兩端的一股(3'或5') (若存在)突出於另一股之外的片段組學特徵可用於分析生物樣本。3'股突出於5'股之外、5'股突出於3'股之外及/或股在一端或兩端係平齊(鈍)的片段的量可用於判定DNA之類型或病況之等級,包括癌症及核酸酶活性缺陷。本文所描述之實施例允許判定此等不同末端形態之量,而先前技術無法達成。末端形態資訊可與末端模體組合,以進一步分析生物樣本。亦描述了相關系統。

Description

單分子股特異性之末端形態
游離DNA已被證明對分子診斷及監測特別有用。基於游離DNA之應用包括非侵入性產前偵測(Chiu RKW等人. Proc Natl Acad Sci USA. 2008; 105:20458-63)、癌症偵測及監測(Chan KCA等人. Clin Chem. 2013;59:211-24;Chan KCA等人. Proc Natl Acad Sci USA. 2013; 110:1876-8;Jiang P等人. Proc Natl Acad Sci USA. 2015;112: E1317-25)、移植監測(Zheng YW等人. Clin Chem. 2012;58:549-58)及組織起源分析(Sun K等人. Proc Natl Acad Sci USA. 2015;112:E5503-12;Chan KCA; Snyder MW等人. Cell. 2016; 164:57-68)。迄今為止開發的游離核酸分析方法包括基於人類基因體中之單核苷酸變異(SNVs)、複本數畸變(CNAs)、游離DNA末端位置或甲基化標記物分析等方法。開發用於偵測新特性之新核酸分析方法且增加現有方法之準確性將係有益的。
雙股游離DNA片段之各股包含兩個末端。一個DNA片段可有四個末端。由於兩股通常並不彼此完全互補,一股可能延伸至另一股之外,從而在末端產生突出部分。此等突出部分在分析中經常被修復形成鈍末端,此將改變游離DNA片段末端之資訊。本案描述如何自各游離DNA片段中獲得末端之原始資訊,以及可如何用於分析。
該方法可同時評估Watson及Crick股之原始5'末端、3'端模體,以及在單鹼基解析度下之相關鋸齒度。在一些實施例中,可準確地分析來自cfDNA分子之整個片段組學特徵,包括但不限於5'突出鋸齒末端、3'突出鋸齒末端、5'縮回的鋸齒末端、3'縮回的鋸齒末端、突出鋸齒末端之末端模體、縮回的鋸齒末端之末端模體、片段末端之基因體座標、片段長度、甲基化相關之cfDNA片段組學特徵,以及其組合。在一些實施例中,末端模體可由跨越分子末端附近位置之一或多個核苷酸來定義。末端模體可由參考基因體中圍繞片段末端所對準之基因體基因座之一或多個核苷酸來定義。在其他實施例中,鋸齒末端可由DNA片段末端突出的單股DNA來定義。鋸齒末端可根據突出的單股DNA之長度及/或股分為不同的組。
在一些實施例中,可組合來自一個DNA片段之不同片段組學特徵。在一些實施例中,組合之片段組學特徵可用於偵測或監測癌症或其他疾病。在其他實施例中,組合之片段組學特徵可用於非侵入性產前偵測。
參考以下詳細描述及附圖,可獲得對本發明實施例性質及優點之更好的理解。
相關申請案之交互參考
本申請案係2023年2月23日遞交之標題為「SINGLE-MOLECULE STRAND-SPECIFIC END MODALITIES」的第63/447,847號美國臨時專利申請案的非臨時申請案,且主張其權益,其出於所有目的以全文引用之方式併入本文中。 術語
「組織」對應於作為一個功能單元分組在一起的一組細胞。在單個組織中可發現多於一種類型之細胞。不同類型之組織可由不同類型之細胞(例如,肝細胞、肺泡細胞或血細胞)組成,但亦可對應於來自不同生物體的組織(母親相對於胎兒)或者對應於健康細胞相對於腫瘤細胞。「參考組織」可對應於用於判定組織特異性甲基化水平之組織。可使用來自不同個體之相同組織類型之複數個樣本來判定該組織類型之組織特異性甲基化水平。
「器官」對應於一組具有相似功能之組織。在單個器官中可發現一或多種類型之組織。器官可係不同器官系統之一部分,包括心血管系統、消化系統、內分泌系統、排泄系統、淋巴系統、表皮系統、肌肉系統、神經系統、生殖系統、呼吸系統及骨骼系統。
「生物樣本」係指取自個體(例如,人類,如孕婦、患有癌症之人或懷疑患有癌症之人、器官移植接受者或懷疑患有涉及器官之疾病過程的個體的任何樣本(例如,心肌梗死中的心臟或中風中的大腦或貧血中的造血系統),且含有一或多種目標核酸分子。生物樣本可係體液,如血液、血漿、血清、尿液、陰道液、來自鞘膜積液(例如,睾丸的)之液體、陰道沖洗液、胸膜液、腹水、腦脊液、唾液、汗液、淚液、痰液、支氣管肺泡灌洗液、乳頭排出液、來自身體不同部位(例如,甲狀腺、乳房)之抽吸液等。亦可使用糞便樣本。在各種實施例中,已富集游離DNA之生物樣本(例如,經由離心方案獲得之血漿樣本)中之大多數DNA可係游離的,例如,大於50%、60%、70%、80%、90%、95%或99%之DNA可係游離的。離心方案可包括例如,3,000 g x 10分鐘,獲得流體部分,且在例如30,000 g下再次重新離心10分鐘以移除殘留細胞。
「序列讀數」係指自核酸分子之任何部分或全部定序之一串核苷酸。例如,序列讀數可係自核酸片段定序之一短串核苷酸(例如,20-150個)、在核酸片段之一端或兩端之一短串核苷酸,或者存在於生物樣本中之整個核酸片段的定序。序列讀數可以多種方式獲得,例如,使用定序技術或使用探針,例如在雜交陣列或捕獲探針中,或者擴增技術,如聚合酶股式反應(PCR)或使用單一引子之線性擴增或等溫擴增。
「終止位置(ending position)」或「末端位置(end position)」 (或僅為「末端(end)」)可指游離DNA分子,例如血漿DNA分子之最外側鹼基,亦即極末端之基因體座標或基因體特性或核苷酸特性。末端位置可對應於DNA分子之任一端。以該方式,若指的係DNA分子之起始及終止,則兩者均對應於終止位置。在實踐中,一個末端位置係藉由,諸如但不限於大規模平行定序或下一代定序、單分子定序、雙股或單股DNA定序文庫製備方案、聚合酶股式反應(PCR)或微陣列之分析方法偵測或判定的游離DNA分子之一個極末端上的最外側鹼基的基因體座標或核苷酸特性。因此,各可偵測之末端可代表生物學上真實的末端,或者末端係向內的一或多個核苷酸,或者係自分子之原始末端延伸的一個或者多個核苷酸,例如,藉由Klenow片段對非鈍末端雙股DNA分子之突出部分的5'鈍化及3'填充。末端位置之基因體特性或基因體座標可自序列讀數與人類參考基因體,例如hg19之比對結果中得出。其可自代表人類基因體原始座標之索引或程式碼目錄中推導出來。其可指藉由但不限於目標特異性探針、迷你定序、DNA擴增讀取的游離DNA分子上的位置或核苷酸特性。
「序列模體」可係指DNA片段(例如,游離DNA片段)中鹼基之短暫重複模式。序列模體可出現在片段之末端,且因此為末端序列的一部分或包括末端序列。「末端模體」可指末端序列之序列模體,該序列模體優先出現在DNA片段之末端,可能針對特定類型的組織。末端模體亦可剛好出現在片段末端之前或之後,從而仍然對應於末端序列。核酸酶可對特定末端模體具有特定的切割偏好,以及對第二末端模體之第二最佳的切割偏好。
術語DNA股之間的「突出部分之長度」可指可藉由比較參考樣本(例如,正常細胞)及差異調控之核酸酶樣本(例如,腫瘤細胞)之間的總血漿DNA或在某一片段長度範圍內之血漿DNA的鋸齒度(例如,鋸齒度指數值)來估計的值。在一些情況下,突出部分之長度基於為判定生物樣本之特徵而選擇的特定DNA片段長度範圍(例如,130-160 bp、200-300 bp)而變化。
在一些實施例中,DNA股中突出部分之長度係表徵兩條DNA股之間的突出部分長度的分類值。例如,「長的」突出部分可包括具有5 nt、6 nt、7 nt、8 nt、10 nt、15 nt、20 nt、30 nt、40 nt、50 nt、100 nt及大於100 nt尺寸之DNA股的突出部分。「短的」突出部分可包括具有0 nt、1 nt、2 nt、3 nt、4 nt、5 nt尺寸之DNA股的突出部分。另外或可替代地,可基於具有超過特定臨限值之突出部分長度之分子的百分比來估計DNA股中突出部分明確的長度。例如,血漿DNA中「長的」突出部分之存在可表示為大於5 nt、6 nt、7 nt、8 nt、10 nt、15 nt、20 nt、30 nt、40 nt、50 nt、100 nt之分子或其組合之百分比。
「校準樣本」可對應於此類生物樣本,其臨床相關DNA (例如,組織特異性DNA分數)之濃度分數係已知的或經由校準方法判定,例如,使用組織特異性之對偶基因,如在妊娠個體中的移植中,由此供體基因體中存在但受體基因體中不存在之對偶基因可用作移植器官的標記物。作為另一個例子,校準樣本可對應於可自中判定末端模體之樣本。校準樣本可用於該兩個目的。
「校準資料點」包括「校準值」及樣本或個體經量測的或已知的特性,例如,年齡或組織特異性之分數(例如,胎兒或腫瘤)。校準值可係為特性已知的校準樣本判定的相對豐度。校準資料點可包括校準值(例如,鋸齒末端值,亦稱為突出部分指數)及已知的(量測的)特性。校準資料點可以多種方式定義,例如,作為離散點或作為校準函式(亦稱為校準曲線或校準表面)。校準函式可自校準資料點之附加數學變換中得出。校準函式可係線性的或非線性的。
「位點」 (亦稱為「基因體位點」)對應於單個位點,其可係單個鹼基位置或一組相關之鹼基位置,例如,CpG位點或更大組的相關鹼基位置。「基因座」可對應於包括複數個位點之區域。基因座可只包括一個位點,此將使基因座在該上下文中等效於位點。
「分離值」對應於涉及兩個值之差異或比率,例如,兩個分數貢獻或兩個甲基化水平。分離值可係簡單的差異或比率。例如,x/y之直接比率係分離值,以及x/(x+y)。分離值可包括其他因素,例如,乘法因素。作為其他例子,可使用值之函式的差異或比率,例如,兩個值之自然對數(ln)的差異或比率。分離值可包括差異或比率。
本文使用之術語「分類」係指與樣本之特定特性相關的任何數值或其他字元。例如,「+」符號(或詞語「正的」)可表示樣本被歸類為具有缺失或擴增。分類可係二元的(例如,正的或負的)或具有更多水平之分類(例如,自1至10或自0至1的等級)。術語「截止值」及「臨限值」係指操作中使用的預定數值。例如,臨限值長度可指此類長度,超過該長度之片段被排除在外。臨限值可係該值,高於或低於該值來應用特定分類。該兩個術語中之任何一個均可用於該兩種上下文中之任一種。
本文使用的術語「參數」意指表徵定量資料集及/或定量資料集之間的數值關係之數值。例如,第一量之第一核酸序列及第二量之第二核酸序列之間的比率(或比率之函式)係參數。
術語「截止值」及「臨限值」係指操作中使用之預定數值。例如,臨限值長度可指此類長度,超過該長度之片段被排除在外。臨限值可係該值,高於或低於該值來應用特定分類。該兩個術語中之任何一個均可用於該兩種上下文中之任一種。截止值或臨限值可係「參考值」,或者自代表特定分類或在兩個或更多個分類之間進行區分的參考值得出。如技術人員將理解的,可以各種方式判定此類參考值。例如,可為具有不同已知分類之兩個不同的個體隊列判定量度,且可選擇參考值作為一個分類之代表(例如,平均值)或在量度之兩個聚類之間的值(例如,被選擇以獲得期望的靈敏度及特異性)。作為另一個例子,可基於樣本之統計分析或類比來判定參考值。可基於期望的準確性(例如,靈敏度及特異性)來判定截止值、臨限值、參考值等的特定值。
「妊娠相關之病症」包括以母體及/或胎兒組織中基因之相對表現水平異常或母親及/或者胎兒中之臨床特徵異常為特徵的任何病症。此等病症包括但不限於子癇前期(Kaartokallio等人. Sci Rep. 2015;5:14107;Medina-Bastidas等人. Int J Mol Sci. 2020;21:3597)、子宮內生長受限(Faxén等人. Am J Perinatol. 1998; 15:9-13;Medina-Bastidas等人. Int J Mol Sci. 2020; 21:3597)、侵入性胎盤形成、早產(Enquobahrie等人. BMC Pregnancy Childbirth. 2009; 9:56)、新生兒溶血病、胎盤功能不全(Kelly等人. Endocrinology. 2017;158:743-755)、胎兒水腫(Magor等人. Blood. 2015;125:2405-17)、胎兒畸形(Slonim等人. Proc Natl Acad Sci USA. 2009;106:9425-9)、HELLP症候群(Dijk等人. J Clin Invest. 2012; 122:4003-4011)、系統性紅斑狼瘡(Hong等人. J Exp Med. 2019;216:1154-1169)以及母親的其他免疫疾病。
「病理等級」 (或者病症等級或病況等級)可指與生物體相關之病理的數量、程度或嚴重性。一個例子係表現核酸酶之細胞紊亂。病理學之另一個例子係移植器官之排斥反應。其他示例性病理可包括自體免疫性發作(例如,損傷腎臟之狼瘡性腎炎或多發性硬化症)、炎症性疾病(例如,肝炎)、纖維化過程(例如,肝硬化)、脂肪浸潤(例如,脂肪肝疾病)、退行性過程(例如,阿茲海默病)及缺血性組織損傷(例如,心肌梗死或中風)。個體之健康狀態可被認為係無病理的分類。病理可係癌症。
術語「癌症等級」可指癌症是否存在(亦即存在或不存在)、癌症之階段、腫瘤之尺寸、是否有轉移、身體之總腫瘤負擔、癌症對治療之反應及/或癌症嚴重程度的其他量測(例如,癌症復發)。癌症等級可係數值或其他標記,如符號、字母及顏色。等級可為零。癌症之級別亦可包括惡性前或癌前病況(狀態)。癌症等級可以多種方式使用。例如,篩查可在先前不知道患有癌症的人中檢查是否存在癌症。評估可調查已被診斷患有癌症的人以監測癌症隨時間之進展、研究治療之有效性或判定預後。在一實施例中,預後可表示為患者死於癌症之機會,或者癌症在特定持續時間或時間後進展之機會,或者癌症轉移之機會或程度。偵測可意指「篩查」,或者可意指檢查具有癌症暗示特徵(例如,症狀或其他陽性測試)的人是否患有癌症。
縮寫「bp」係指鹼基對。在一些情況下,「bp」可用於表示DNA片段之長度,亦即使該DNA片段可能係單股的且不包括鹼基對。在單股DNA之上下文中,「bp」可被解釋為以核苷酸為單位提供長度。
縮寫「nt」係指核苷酸。在一些情況下,「nt」可用於表示鹼基單元中單股DNA之長度。而且,「nt」可用於表示相對位置,如被分析基因座之上游或下游。對於雙股DNA,「nt」仍然可指單股之長度,而不係兩股中核苷酸之總數,除非上下文另有明確指示。在一些涉及技術概念化、資料表示、處理及分析之上下文中,「nt」及「bp」可互換使用。
術語「鋸齒末端」可指DNA之黏性末端、DNA之突出部分、股之突起,或者雙股DNA包括未與DNA之另一股雜交的DNA股。「鋸齒末端值」係鋸齒末端程度之量度。鋸齒末端值可與雙股DNA中突出於第二股之外的一股之長度成比例。複數個DNA分子之鋸齒末端值可包括考慮DNA分子中的鈍末端。
在一些情況下,鋸齒末端值可提供複數個游離DNA分子中突出於其他股之外的股之集體量度。鋸齒度的集體量度可基於複數個游離DNA分子中突出部分之估計長度來判定,例如,各游離DNA分子的單個量測之平均值、中值或其他集體量度。在一些情況下,針對特定片段長度範圍(例如,130-160 bp、200-300 bp)判定鋸齒度之集體量度。
術語「長度比」可指在特定片段長度範圍內之游離DNA分子的量。長度比可與特定片段長度範圍內之游離DNA分子的量成比例,該量藉由另一特定片段長度範圍內之另一量的游離DNA分子進行標準化。當另一特定片段長度範圍涉及所有長度範圍時,可使用術語「長度頻率」。
術語「比對」及相關術語可指將序列與參考序列相匹配。參考序列可係參考基因體(例如,人類基因體)或特定分子之序列。此類參考序列可包括至少100 kb、1 Mb、10 Mb、50 Mb、100 Mb及更多。該比對方法不能手動執行,且係由專門的電腦軟體執行的。比對可能涉及長且多的序列(例如,至少1,000、10,000、100,000、100萬、1000萬或1億個序列)。另外,比對可能涉及序列本身內的可變性或序列讀數內的誤差。因此,具有該可變性或誤差之比對可能不需要與參考序列精確匹配。
術語「即時」可指在某一時間限制內完成之計算操作或過程。時間限制可係1分鐘、1小時、1天或7天。
術語「子序列」可指小於與核酸分子對應完整序列之一串鹼基。例如,當核酸分子之完整序列包括5個或更多個鹼基時,子序列可包括1、2、3或4個鹼基。在一些實施例中,子序列可指形成單元之一串鹼基,其中該單元以串聯方式重複多次。實例包括在與三核苷酸重複病症相關之基因座處重複的3-nt單元或子序列、作為微衛星重複5-50次的1-nt至6-nt單元或子序列、作為小衛星重複5-50次的10-nt至60-nt單元或子序列,或者在其他遺傳元件中,如Alu重複序列。
「臨床相關之DNA」可指待量測之特定組織來源的DNA,例如,以判定該DNA之濃度分數或對樣本(例如,血漿)之表型進行分類。臨床相關DNA之實例係母體血漿中之胎兒DNA或者患者血漿或具有游離DNA之其他樣本中的腫瘤DNA。另一個例子包括量測移植患者之血漿、血清或尿液中之移植物相關DNA的量。另一個例子包括量測個體血漿中造血及非造血DNA之濃度分數,或者樣本中肝DNA片段(或其他組織)之濃度分數或腦脊液中腦DNA片段之濃度分數。
術語「並行分析」可指使用超過一種片段組學特徵。僅使用核酸分子之一個末端之5'末端模體或僅使用鋸齒末端形態(例如,5'末端突出的)將不為並行分析。然而,使用來自分子之兩個末端之鋸齒末端形態的組合、一端之一個鋸齒末端形態及序列末端模體的組合,或者兩端之鋸齒末端形態及序列末端模體的組合將為並行分析的一部分。
術語「約(about)」或「近似(approximately)」可意指在由本領域普通技術人員判定之特定值之可接受的誤差範圍內,此將部分取決於如何量測或判定該值,亦即量測系統的限制。例如,根據本領域之實踐,「約」可意指在1個或超過1個標準偏差內。可選地,「約」可意指給定值之高達20%、高達10%、高達5%或高達1%的範圍。可選地,特別係關於生物系統或過程,術語「約」或「近似」可意指在值之一個數量級內、在5倍內,且更佳在2倍內。在申請書及申請專利範圍中描述了特定值之情況下,除非另有說明,否則應假設術語「約」意指在特定值之可接受誤差範圍內。術語「約」可具有本領域普通技術人員通常理解之含義。術語「約」可指±10%。術語「約」可指±5%。
在提供值之範圍的情況下,應當理解,除非上下文另有明確指示,否則亦具體揭露該範圍之上限及下限之間的每一個介於中間的值,至下限單位的十分之一。在該範圍中之任何所描述值或介於中間的值,以及該範圍中之任何其他所描述值或介於中間的值之間的各較小範圍均包含在本揭露之實施例內。此等較小範圍之上限及下限可獨立地包括在該範圍中或排除在該範圍外,且其中任一個、兩個均不或兩個極限包括在較小範圍內之各範圍亦包括在本揭露內,受該範圍中任何明確排除之極限的限制。在該範圍包括一個或兩個極限之情況下,排除彼等包括的極限中之任一個或兩個的範圍亦包括在本揭露中。
可使用標準縮寫,例如bp,鹼基對;kb,千鹼基;pi,皮升;s或sec,秒;min,分鐘;h或hr,小時;aa,胺基酸;nt,核苷酸;等等。
除非另有定義,否則本文中使用之所有技術及科學術語具有與本揭露技術之普通技術人員通常理解之含義相同的含義。儘管在本揭露之實施例的實踐或測試中可使用與本文所描述之彼等方法及材料類似或等效的任何方法及材料,但現在可描述一些潛在的及示例性方法及材料。 發明詳述
游離DNA (cfDNA)分子係非隨機片段化的,且cfDNA分子之片段化模式含有豐富的分子資訊。例如,cfDNA之特徵性長度特徵顯示出約166 bp之模式頻率,較小之分子以10-bp之週期性形成一系列峰(Lo等人. Sci Transl Med. 2010;2:61ra91)。血漿DNA片段之該長度模式表明,在細胞死亡及/或凋亡時,在DNA分子釋放至血液循環中之過程中,核小體間及核小體內均存在裂解。此外,吾等小組先前已報導,在血漿DNA分子之產生過程中發現基因體位置的子集被優先切割(Chan等人. Proc Natl Acad Sci USA. 2016;113:E8159-E8168;Jiang等人. Proc Natl Acad Sci USA. 2018; 115: E10925-E10933);該較佳切割可反映cfDNA之來源組織(Jiang等人. Proc Natl Acad Sci USA. 2018; 115: E10925-E10933;Sun等人. Proc Natl Acad Sci U S A. 2018; 115: E5106-E5114)。此外,吾等已證實,不同核酸酶與具有特徵性末端特徵(亦即5'末端模體及5'突出鋸齒末端)之游離DNA分子相關(Serpas等人. Proc Natl Acad Sci USA. 2019;116:641-649;Han等人. Am J Hum Genet. 2020; 106: 202-214,Ding等人. Clin Chem. 2022;68:917-926)。5'末端模體代表cfDNA片段5;末端之序列背景。5'突出鋸齒末端代表cfDNA分子中之5'突出單股DNA。最近,游離DNA末端特徵顯示出用作液體活檢生物標誌物之潛力(Jiang等人. Cancer Discov. 2020; 10:664-673;Jiang等人. Genome Res. 2020; 30:1144-1153)。鋸齒末端亦在US 2020/0056245 A1及US 2022/0177971 A1中進行了描述,該等兩項專利均出於所有目的以全文引用之方式併入本文中。
與廣泛研究之5'末端模體及5'突出鋸齒末端相反,實際3'末端模體及3'突出鋸齒末端並未得到適當之研究,主要係由於在定序文庫製備過程中發生之人工修飾。典型文庫製備方法包含末端修復步驟。在末端修復過程中,移除3'突出鋸齒末端,且使用相對之5'突出鋸齒末端作為DNA模板延長3'縮回的末端。因此,原始之3'末端被修飾,導致3'末端模體附近核苷酸資訊之改變以及3'突出鋸齒末端之丟失。此外,3'突出鋸齒末端被移除以形成鈍末端。由於此類末端修復步驟,自典型文庫製備方法推導出的鈍末端資訊係不可靠的。
最近,一個小組開發了一種NGS文庫製備方法,稱為XACTLY,以經由基於序列適配子連接之方法研究鋸齒末端(Harkins等人. Nucleic Acids Res. 2020; 48: e47)。例如,Harkins Kincaid等人在無末端修復步驟之情況下將含有7nt條形碼(亦即表示離散末端類型及長度之唯一末端標識符(UEI))的Y形適配子直接連接至原始DNA模板上(Harkins Kincaid等人. Nucleic Acids Res. 2020; 48: e47)。對經連接之產物進行短讀數定序(亦即Illumina定序平台)。據推測,DNA分子之天然末端能夠根據與讀數相連之7nt條形碼的序列資訊推斷出來。然而,如Harkins等人研究中所報導的,5' UEI (亦即Illumina P5適配子)具有的保真度遠低於3' UEI (亦即Illumina P7適配子) (Harkins Kincaid等人. Nucleic Acids Res. 2020; 48: e47)。與P5適配子相關之不準確性係因為無論適配子之突出末端是否與模板DNA上的突出末端正確匹配,P5適配子與模板DNA之第一次連接均會發生,而P7適配子連接可能僅在第一次連接事件正確時發生。換言之,亦即使當間隙(亦即一股在另一股上無互補核苷酸之區域)及翻捲(flap) (亦即一個適配子之核苷酸未與股雜交之區域)存在於模板DNA及適配子序列之間的雜交區域中時,P5適配子連接亦會發生。在藉由XACTLY方法製備之定序文庫中,雙股DNA將變性為兩個單股DNA分子。該單股DNA分子之5'及3'末端分別被P5及P7標記。因此,XACTLY方法存在固有侷限性: 1. 至少一端不能夠使用XACTLY方法以精確方式進行分析。 2. 不能夠有效地同時分析DNA分子之兩股。 3. 不能夠量測DNA分子之真實長度。
在本揭露中,吾等開發了新的方法來同時高保真地偵測cfDNA分子之天然片段組學特徵,包括片段長度、末端模體及鋸齒末端。在一實施例中,使用DNA連接酶,雙股cfDNA片段可與一對髮夾適配子適當連接,此取決於該雙股cfDNA分子之末端形態,形成環狀DNA分子。該髮夾適配子含有分子條形碼,且攜帶具有不同長度之鋸齒末端或鈍末端。不同的cfDNA片段將與含有不同分子條形碼之髮夾適配子連接,該不同分子條形碼對應於鋸齒末端長度(例如,1-50 nt)及鋸齒類型(鈍末端、5'突出鋸齒末端、3'突出鋸齒末端及以上之組合)。連接產物可用酶進行處理以移除不完整環狀DNA分子,從而富集由髮夾適配子介導之DNA連接所產生的所需環狀DNA分子(亦即負向選擇步驟)。
富集環狀DNA分子之產物可進一步進行環狀DNA分子的直接富集,如單分子即時定序(例如,Pacific Biosciences)及滾環擴增(亦即正向選擇步驟),以將不準確連接之影響最小化。由於只有一個完整環狀DNA分子可經多次定序,從而在單分子即時定序過程中生成子讀數,因此選擇具有三個或更多個子讀數之讀出允許排除不完整環狀DNA分子。類似地,僅完整環狀DNA分子可經由滾環擴增來擴增。在一些實施例中,酶包括但不限於核酸外切酶I、核酸外切酶II、核酸外切酶III、核酸外切酶IV、核酸外切酶V、核酸外切酶VI、核酸外切酶VII或核酸外切酶VIII。在又一實施例中,正向選擇步驟及負向選擇步驟可單獨進行或組合進行。在定序後,可藉由分析條形碼序列來推導單個cfDNA片段之天然鋸齒末端。一旦判定cfDNA分子各末端之鋸齒末端,因此便可以1-nt之解析度準確地分析來自cfDNA分子的整個片段組學特徵,包括但不限於5'突出鋸齒末端、3'突出鋸齒末端、5'縮回的鋸齒末端、3'縮回的鋸齒末端、突出鋸齒末端之末端模體、縮回的鋸齒末端之末端模體、片段末端之基因體座標、片段尺寸、甲基化相關之cfDNA片段組學特徵,以及以上的組合。在一實施例中,Watson股及Crick股之間的長度差可用作另一種類型之片段組學特徵。
在一些實施例中,末端模體可由一或多個跨越分子末端處或分子末端附近位置之核苷酸定義。一個分子可有4個末端。末端模體可由參考基因體中圍繞片段末端所對準之基因體基因座的一或多個核苷酸定義。在其他實施例中,鋸齒末端可由DNA片段末端突出之單股DNA定義。鋸齒末端可根據突出之單股DNA之長度及股而分為不同的組。在其他實施例中,可組合來自一個DNA片段之不同片段組學特徵。在一實施例中,組合之片段組學特徵可用於偵測或監測癌症或其他疾病。在另一實施例中,組合之片段組學特徵可用於非侵入性之產前偵測。末端模體描述於US 2021/0238668 A1中,其以全文引用之方式併入本文中。 I. 單分子末端形態之 並行分析原理
圖1顯示了單分子即時定序平台(例如,Pacific Biosciences (PacBio)平台)上之單分子末端形態之並行分析的示意性概覽。階段104顯示了不同cfDNA分子,其含有不同鋸齒末端或鈍末端。示例性片段108在左側具有鈍末端,且在右側具有3-nt之5'突出鋸齒末端。
階段112顯示了髮夾適配子庫中之不同髮夾適配子。髮夾適配子庫含有具有鈍末端之適配子及具有鋸齒末端(亦稱為突出部分)之適配子。具有鋸齒末端之各髮夾適配子均具有不同長度(藉由突出部分116中「N」的數目指示)的突出單股末端。與PacBio定序平台相容之與髮夾適配子一起合成的條形碼序列可用於指示鋸齒末端類型(例如,5'或3'突出末端)及鋸齒末端長度(藉由以不同圖案填充之矩形120及124表示)。
在階段128,將cfDNA分子與髮夾適配子連接。將片段108在其鈍末端(左側)與髮夾適配子132連接。將片段108在其3-nt 5'突出鋸齒末端(右側)與髮夾適配子136連接。適當的連接產生分子140。
其他分子可產生於連接。分子144代表具有僅連接至一端的髮夾適配子的片段。分子148代表無髮夾適配子的片段。分子152具有正確連接至鈍末端的髮夾適配子。然而,分子152具有不正確連接至5'突出末端的髮夾適配子,在cfDNA片段及髮夾適配子之間存在間隙。分子156具有正確連接至鈍末端的髮夾適配子。然而,分子156具有不正確連接至5'突出末端的髮夾適配子,髮夾適配子產生翻捲,其中髮夾適配子的核苷酸不與原始cfDNA片段完全雜交。
在階段160,適配子連接的分子可用能夠消化不完整的環狀DNA分子(例如,分子152及分子156)的一或多種酶進行處理。酶消化不完整的適配子連接的分子可稱為負向選擇,因為不正確連接之分子被選擇及移除。
在階段164,可在PacBio平台上對酶處理之連接產物進行定序。只有當具有兩端之cfDNA片段與對應於天然鋸齒末端之髮夾適配子適當連接以形成完整環狀DNA時,才能對該環狀DNA產物進行定序(例如,藉由滾環擴增),以產生各股之複數個子讀數。僅擴增及/或定序完整連接適配子之分子可稱為正向選擇,因為正確連接之分子被選擇且進一步分析。
在階段168,對序列進行分析。定序後,可讀取兩端之條形碼序列資訊,以推導鋸齒末端及/或鈍末端之存在,以及鋸齒末端之類型及長度(若存在)。基於推導出的末端,吾等可進一步偵測cfDNA片段之5'末端模體、3'末端模體及/或各股之長度。可評估原始cfDNA分子之天然片段組學特徵。
圖2A及2B顯示了在下一代定序(NGS)平台(例如,Illumina平台)上並行分析單分子末端形態之示意性概覽。環狀cfDNA分子可根據本揭露中之實施例用經修飾之髮夾適配子製備。階段104可在圖2A中重複。階段112可包括經修飾之髮夾適配子,其含有限制酶之切割位點。例如,切割位點204及208可包括在髮夾適配子中。
在圖2B中,類似於階段128,將DNA片段用髮夾適配子連接,且類似於階段160,經適配子連接之分子將用能夠消化不完整環狀DNA分子的一或多種酶進行處理(亦即負向選擇)。類似於階段160,經酶處理之連接產物將藉由滾環擴增(亦即正向選擇)進行擴增。只有兩端與對應於天然鋸齒末端/鈍末端之髮夾適配子適當連接的cfDNA片段會被擴增。
在階段250,用指定限制酶處理滾環擴增產物,以在髮夾適配子中之切割位點處切割。因此,經由滾環擴增產生之大DNA分子被切割成小DNA分子,此適用於Illumina定序或其他類似的定序。
在階段254,將定序適配子連接至切割之小DNA分子上。定序適配子組態用於Illumina定序。
圖2B中之分析可與圖1之階段168類似。 A. 示例性之正向選擇方法
圖3係分析生物樣本之示例性過程300的流程圖。過程300可判定鋸齒末端是否存在於cfDNA分子之兩端、5'或3'末端是否係突出的、突出部分的長度及/或突出部分的序列。突出於另一股之外的股可理解為係突出的。在一些實施例中,圖3之一或多個過程方框可由系統,包括系統2400執行。生物樣本可包括複數個核酸分子。核酸分子可係游離的及雙股的,具有第一股及第二股。
在方框302處,對於複數個核酸分子中之各核酸分子,在核酸分子之第一末端,將第一髮夾適配子連接至核酸分子之第一股及核酸分子之第二股。第一髮夾適配子可包括第一序列標識符。第一序列標識符可在第一髮夾適配子的第一末端識別在第一髮夾適配子的第二末端無互補部分的第一長度的零個或多個核苷酸。髮夾中無互補部分的核苷酸的長度對應於核酸分子的鋸齒末端的長度。零個核苷酸代表鈍末端且其中髮夾適配子末端係互補的。例如,第一序列標識符可編碼的長度為0、1、2、3、4、5、6、7、8、9或10個核苷酸。第一序列標識符可編碼第一髮夾連接的核酸分子的3'股或5'股是否突出於另一股之外。在一些實施例中,第一序列標識符可在第一髮夾適配子的第一末端編碼在第一髮夾適配子的第二末端無互補部分的零個或多個核苷酸的子序列。
第一髮夾適配子可包括圖1中之髮夾適配子132及136。第一序列標識符可係由矩形120及124表示之核苷酸。在第一髮夾適配子之第二末端無互補部分的第一髮夾適配子之第一末端的零個或多個核苷酸長度可包括突出部分116。
在方框304處,對於複數個核酸分子中之各核酸分子,在核酸分子之第二末端將第二髮夾適配子連接至第一股及第二股。第二髮夾適配子可包括第二序列標識符。第二序列標識符可在第二髮夾適配子之第一末端識別在第二髮夾適配子之第二末端無互補部分的第二長度的零個或多個核苷酸。第二序列標識符可與第一序列標識符具有相似特性。第一序列標識符及第二序列標識符可使用相似編碼。序列標識符中某些預先判定之子序列可對應於不同數值。利用四種核苷酸(A、T、G、C),長度可以數值鹼基4表示。在連接後生成複數個經連接之核酸分子。
在一些實例中,可進行負向選擇。可在連接複數個第一髮夾適配子及複數個第二髮夾適配子後將核酸外切酶添加至複數個經連接之核酸分子中,以移除複數個經連接之核酸分子的不正確連接子集。對於不正確連接之子集中之各核酸分子,相應之核酸分子不與相應之第一髮夾適配子或相應之第二髮夾適配子完全雜交(例如,存在「間隙」),或者相應之第一髮夾適配子或相應之第二髮夾適配子不與相應之核酸分子完全雜交(例如,存在「翻捲」)。負向選擇可類似於圖1之階段160,其中分子144、148、152及156被移除。
在方框306處,可對複數個經連接之核酸分子之第一子集執行滾環擴增以形成複數個多聯體。第一子集可不包括與不正確連接的子集相同的核酸分子中的任何核酸分子。第一子集中之各核酸分子均可與複數個第一髮夾適配子的相應的第一髮夾適配子及複數個第二髮夾適配子的相應的第二髮夾適配子連接。第一子集中之各核酸分子均可與髮夾適配子正確連接,而無間隙或翻轉,類似於圖1中的分子140。第一集合的核酸分子股的各核苷酸均可與另一股上的互補核苷酸雜交。
第一子集的第一部分的各核酸分子均可在相應的第一末端具有突出於相應的第二股之外的相應的第一股。第一股在第一末端可係5'股或3'股。在一些實例中,第一子集的第二部分的各核酸分子均可具有相應的第一股,亦即使在相應的第一末端具有相應的第二股。在一些實例中,第一子集的第二部分的各核酸分子在相應的第一末端均具有突出於相應的第一股之外的相應的第二股。相應的第一股可係5'股。相應的第二股可係3'股。
第一子集可包括對應於不同組合鋸齒末端特性之部分:含有5'突出鋸齒末端及3'突出鋸齒末端(5-3);5'突出鋸齒末端及5'突出鋸齒末端(5-5);3'突出鋸齒末端及3'突出鋸齒末端(3-3);5'突出鋸齒末端及鈍末端(5-B);3'突出鋸齒末端及鈍末端(3-B);以及鈍末端及鈍末端(B-B)之DNA分子。
在方框308處,對多種多聯體中之每種多聯體進行序列,以識別相應之第一序列標識符及相應之第二序列標識符。第一序列標識符及第二序列標識符可各自包括指示連續核苷酸為標識符的一部分的核苷酸的子序列。定序可係藉由單分子即時定序、下一代定序或任何適合之定序技術。定序可與滾環擴增同時發生。
可使用第一序列標識符判定複數個經連接之核酸分子之第一子集中的核酸分子之第一末端存在的突出部分的長度。第一序列標識符可包括對應於突出部分長度之子序列。另外,第一序列標識符可包括指示突出部分是否存在於當前股或互補股上的子序列。
可使用第二序列標識符判定複數個經連接之核酸分子之第一子集中的核酸分子之第二末端存在的突出部分的長度。可以與第一序列標識符相似的方式使用第二序列標識符。
在一些實例中,可使用第一序列標識符的序列判定複數個經連接之核酸分子之第一子集中的核酸分子之第一末端存在的突出部分的第一序列末端模體。第一序列標識符可指示哪股在末端係突出的,且適當之子序列可能與突出部分相關。另外,第一序列標識符指示突出部分之長度,因此可判定突出部分之整個序列。在一些實施例中,可能無法判定突出部分之整個序列,且相反可判定末端模體(2、3、4、5、6、7、8、9或10個核苷酸)。在一些實例中,可使用第二序列標識符之序列判定複數個經連接之核酸分子之第一子集中的核酸分子之第二末端存在的突出部分的第二序列末端模體。
在一些實例中,可使用相應的第一標識符之序列,針對在第一子集之第一末端具有突出部分的各核酸分子,判定5'股或3'股是否突出於另一股之外。在一些實例中,可使用相應的第二標識符之序列,針對在第一子集之第二末端具有突出部分的各核酸分子,判定5'股或3'股是否突出於另一股之外。
在一些實例中,複數個第一髮夾適配子中之各第一髮夾適配子均可包括第一切割位點。複數個第二髮夾適配子中之各第二髮夾適配子均可包括第二切割位點。過程可包括在相應的第一切割位點及相應的第二切割位點處切割複數個多聯體中之各多聯體。
過程300可用於在本文揭露之其他過程中判定長度或末端模體。在一些實例中,多種分子中之各核酸分子均具有大於第一臨限值長度的長度。在一些實例中,多種分子中之各核酸分子均具有小於第二臨限值長度的長度寸。第一臨限值長度及第二臨限值長度可獨立地為90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340或350。可藉由將對應於相應核酸分子末端之子序列與參考基因體進行比對來判定各核酸分子之長度。
病況可係癌症(例如但不限於HCC及大腸直腸癌[CRC])、自體免疫性疾病(例如,系統性紅斑狼瘡)、妊娠相關之病症或本文描述之任何病況。可自患有某一等級之病況的一或多名個體或者一或多名健康個體判定參考值。
在一些實例中,病況之等級未經判定。相反,可使用比較來判定臨床相關DNA之濃度分數。可自具有臨床相關DNA之已知濃度分數的一或多名個體中判定參考值。參考值可為使用校準樣本判定之校準值。
在一些實例中,可針對臨床相關之DNA富集對應於複數個核酸分子之讀數。例如,生物樣本可自懷有胎兒之女性個體獲得。方法亦可包括選擇對應於具有突出於另一末端之外的5'股或3'股之核酸分子子集的讀數。方法可包括針對胎兒之特徵分析核酸分子的子集。例如,特徵可為在胎兒基因體中存在畸變(例如,突變、非整倍體)。作為另一個例子,可藉由選擇在一端具有鈍末端之讀數來針對母體樣本富集讀數。可藉由分析不同鋸齒末端形態中DNA之濃度來富集其他臨床相關之DNA。可選擇具有更高濃度之臨床相關DNA的鋸齒末端形態,以產生富集之資料集。末端形態可包括任何給定片段之兩端的末端形態。
過程300可包括額外的實施例,如本文所描述之任何單一實施例或實施例的任何組合及/或結合本文其他地方所描述之一或多個其他過程。
儘管圖3顯示了過程300之示例性方框,但在一些實施例中,過程300可包括與圖3中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程300的兩個或更多個方框可並行執行。 B. 示例性之負向選擇方法
圖4係分析生物樣本之示例性過程400的流程圖。過程400可判定鋸齒末端是否存在於cfDNA分子之兩端、5'或3'末端是否係突出的、突出部分之長度及/或突出部分之序列。突出於另一股之外的股可被理解為係突出的。在一些實施例中,圖4之一或多個過程方框可藉由系統2400執行。
在方框402處,對於複數個核酸分子中之各核酸分子,在核酸分子之第一末端將第一髮夾適配子連接至核酸分子之第一股及核酸分子之第二股。可以與方框302相同的方式執行方框402。
在方框404處,對於複數個核酸分子中之各核酸分子,在核酸分子之第二末端將第二髮夾適配子連接至第一股及第二股。可以與方框304相同的方式執行方框404。
在方框406處,將核酸外切酶添加至複數個經連接之核酸分子中,以移除複數個經連接之核酸分子之第一子集。對於第一子集中之各核酸分子,相應的核酸分子不與相應的第一髮夾適配子或相應的第二髮夾適配子完全雜交,或者相應的第一髮夾適配子或相應的第二髮夾適配子不與相應的核酸分子完全雜交。
在方框408處,可對複數個經連接之核酸分子之第二子集中之各連接之核酸分子進行定序,以識別相應的第一序列標識符及相應的第二序列標識符。第二子集係在移除第一子集後保留於生物樣本中之連接的核酸分子。可藉由下一代定序、單分子即時定序或本文描述之任何定序技術來執行定序。
可使用第一序列標識符判定複數個經連接之核酸分子之第二子集中的核酸分子之第一末端存在的突出部分的長度。第一序列標識符可包括對應於突出部分長度之子序列。另外,第一序列標識符可包括指示突出部分是否在當前股或互補股上之子序列。
可使用第二序列標識符判定複數個經連接之核酸分子之第二子集中的核酸分子之第二末端存在的突出部分的長度。可以與第一序列標識符相似的方式使用第二序列標識符。
在一些實例中,可使用第一序列標識符之序列判定複數個經連接之核酸分子之第二子集中的核酸分子之第一末端存在的突出部分之第一序列末端模體。第一序列標識符可指示哪股在末端係突出的,且適當之子序列可能與突出部分相關。另外,第一序列標識符指示突出部分之長度,因此可判定突出部分之整個序列。在一些實施例中,可能無法判定突出部分之整個序列,且反而可判定末端模體(2、3、4、5、6、7、8、9或10個核苷酸)。在一些實例中,可使用第二序列標識符之序列判定複數個經連接之核酸分子之第二子集中的核酸分子之第二末端存在的突出部分之第二序列末端模體。
在一些實例中,可使用相應的第一標識符之序列,針對第二子集的在第一末端具有突出部分之各核酸分子,判定5'股或3'股是否突出於另一股之外。在一些實例中,可使用相應的第二標識符之序列,針對第二子集的在第二末端具有突出部分之各核酸分子,判定5'股或3'股是否突出於另一股之外。
在一些實例中,複數個第一髮夾適配子中之各第一髮夾適配子可包括第一切割位點。複數個第二髮夾適配子中之各第二髮夾適配子可包括第二切割位點。過程可包括在相應的第一切割位點及相應的第二切割位點切割複數個多聯體中之各多聯體。
在一些實例中,可針對臨床相關之DNA富集樣本,如關於過程300所解釋的。
過程400可包括額外的實施例,如本文所描述之任何單一實施例或實施例之任何組合及/或結合本文其他地方所描述之一或多個其他過程(包括過程300)。
儘管圖4顯示了過程400之示例性方框,但在一些實施例中,過程400可包括與圖4中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程400之兩個或更多個方框可並行執行。 II. 病況分析及偵測
可分析及偵測各種病況。癌症及核酸酶活性缺陷係可使用鋸齒末端形態及/或序列末端模體來分析及偵測之病況的實例。亦可分析及偵測其他病況,包括以異常核酸酶活性為特徵之病況。 A. 癌症
出於說明目的,分別製備了來自一名健康個體及一名肝細胞癌(HCC)患者之血漿DNA樣本的定序文庫。使用PacBio定序平台對此等定序文庫進行定序,分別獲得59,133及227,198個循環一致性定序(CCS)讀數。使用具有鈍末端、5'突出鋸齒末端(長度範圍為1-10 nt)及3'突出鋸齒末端(長度範圍為1-10 nt)之髮夾適配子。 1. 利用自單分子末端形態之 並行分析推導的鋸齒末端的偵測
據報導,與健康對照組相比,HCC血漿DNA樣本中5'突出鋸齒末端的存在更高(Jiang等人., Genome Res. 2020;30:1144-1153)。在實施例中,可以更精確、準確及全面之方式自單分子末端形態之並行分析中推導出5'突出鋸齒末端、3'突出鋸齒末端及鈍末端,從而潛在地提高診斷能力。
圖5A顯示了HCC及健康個體中5'突出鋸齒末端、3'突出鋸齒末端及鈍末端之頻率。y軸顯示頻率。x軸顯示鋸齒末端或鈍末端之類型。兩個不同的條形圖顯示健康個體及患有HCC之個體之比較。單獨分析來自一個cfDNA片段之兩側鋸齒末端。頻率係基於末端之總數(各分子兩個末端),而不係分子之總數。
如圖5A所示,與健康個體相比,HCC病例中5'突出鋸齒末端之頻率更高(59.40%相對於55.84%)。HCC病例中,在3'突出鋸齒末端(23.51%相對於25.57%)及鈍末端(17.09%相對於18.59%)中觀測到略微下降。
圖5B顯示了不同組合鋸齒末端分類之分子的頻率。y軸以百分比形式顯示頻率。x軸顯示了各分子兩端不同的組合鋸齒末端特性:含有5'突出鋸齒末端及3'突出鋸齒末端(5-3);5'突出鋸齒末端及5'突出鋸齒末端(5-5);3'突出鋸齒末端及3'突出鋸齒末端(3-3);5'突出鋸齒末端及鈍末端(5-B);3'突出鋸齒末端及鈍末端(3-B);以及鈍末端及鈍末端(B-B)zDNA分子群體。兩個不同的條形圖顯示HCC個體及健康個體。同時分析來自一個cfDNA片段之兩側鋸齒末端。
如圖5B所示,與健康樣本相比,HCC病例顯示屬於類別5-5 (37.32%相對於33.32%)及5-B (18.75%相對於17.65%)組之cfDNA片段的量較高,但屬於類別5-3 (25.41%相對於27.39%)及B-B組(4.28%相對於5.94%)之cfDNA片段的量較低。與單一末端相比(7.12%),當吾等同時分析兩端(10.21%)時,HCC及健康個體之間此等分類間的累積差異更高。此等結果表明,對來自cfDNA片段兩側之鋸齒末端形態之並行分析可提供更詳細的資訊,此在先前發表之技術中係不可獲得的,且提高了診斷能力。 2. 利用自單分子末端形態之 並行分析推導的片段尺寸的偵測
在一實施例中,自單分子末端形態之並行分析推導的鋸齒末端及片段尺寸可與鋸齒末端類別一起進行分析。
圖6A顯示了來自健康個體及HCC個體之血漿DNA樣本之總體尺寸分佈的圖。y軸顯示以百分比為單位之頻率。x軸顯示以bp為單位之尺寸。與健康個體相比,HCC病例中之片段長度略微更短。
圖6B顯示了不同組合鋸齒末端分類之長度小於150 bp之片段頻率的圖。y軸係以百分比為單位之該類別中具有小於150 bp之長度相比該類別中所有長度之分子的頻率。x軸列出了組合鋸齒末端分類:5'突出鋸齒末端及3'突出鋸齒末端(5-3);5'突出鋸齒末端及5'突出鋸齒末端(5-5);3'突出鋸齒末端及3'突出鋸齒末端(3-3);5'突出鋸齒末端及鈍末端(5-B);3'突出鋸齒末端及鈍末端(3-B);以及鈍末端及鈍末端(B-B)。x軸亦列出了所有cfDNA片段。同時分析了來自一個cfDNA片段之兩側末端。
圖6C顯示了不同組合鋸齒末端分類之長度大於280 bp之片段頻率的圖。y軸係以百分比為單位之頻率。x軸列出了組合鋸齒末端分類及所有cfDNA片段。
如圖6B之「所有」 cfDNA片段類別中所示,短cfDNA片段(<150bp)之頻率在HCC病例中更高(24.58%相對於15.82%)。相反,如圖6C之「所有」類別中所示,與健康個體相比,HCC病例中長cfDNA片段(>280bp)之頻率更低(14.81%相對於24.94%)。
然後,吾等根據兩端之鋸齒末端類型將cfDNA片段分為不同的組。如圖6B所示,與所有cfDNA片段相比(24.58%相對於15.82%),在HCC病例及健康病例之間,兩端具有鈍末端之cfDNA片段(B-B;24.44%相對於10.27%)及兩端具有3'突出鋸齒末端之cfDNA片段(3-3;33.45%相對於19.78%),以及具有3'突出鋸齒末端及鈍末端之cfDNA片段(3-B;26.38%相對於15.09%)之群體在短cfDNA片段之頻率上顯示出更大的差異。
如圖6C所示,與所有cfDNA片段相比(14.81%相對於24.94%),在HCC病例及健康病例之間,兩端具有鈍末端之cfDNA片段(B-B;20.29%相對於57.60%)及具有5'突出鋸齒末端及鈍末端之cfDNA片段(5-B;11.61%相對於25.83%),以及具有3'突出鋸齒末端及鈍末端之cfDNA片段(3-B;15.78%相對於28.11%)之群體在長cfDNA片段之頻率上顯示出更大的差異。
圖7A係不同類型之鋸齒末端之短片段與長片段的比率的圖。y軸係短(<150 bp)片段與長(>280 bp)片段之比率。x軸係組合鋸齒末端分類及所有cfDNA片段。不同的條形圖顯示HCC病例及健康病例。同時分析來自一個cfDNA片段之兩側末端。
圖7B係HCC病例與健康病例之短/長比率之倍數變化的圖。y軸係倍數變化,其自HCC病例之短/長比率除以健康病例之短/長比率來計算。x軸係組合鋸齒末端分類及所有cfDNA片段。
當與所有片段相比時(所有;1.65相對於0.63;倍數變化:2.61),HCC病例及健康病例之間的短/長比率(亦即片段<150bp之量/片段>280bp之量)之差異在兩端具有鈍末端之cfDNA片段(B-B;1.20相對於0.18;倍數變化:6.75)及具有5'突出鋸齒末端及鈍末端之cfDNA片段(5-B;1.90相對於0.61;倍數變化:3.13),以及具有3'突出鋸齒末端及鈍末端之cfDNA片段(3-B;1.67相對於0.53;倍數變化:3.11)中增加。圖7A及7B顯示某些類型之鋸齒末端或鋸齒末端之某些組合在區分健康病例及HCC病例方面可與使用片段而不考慮其鋸齒末端類型一樣有效或更有效。 3. 利用自單分子末端形態之 並行分析推導的末端模體的偵測
據報導,與健康個體相比,患有HCC之患者之血漿DNA樣本中的5' CCCA末端模體的存在降低(Jiang等人. Cancer Discov. 2020;10:664-673)。在實施例中,可單獨分析5'突出鋸齒末端、3'突出鋸齒末端及鈍末端中之5' CCCA末端模體。
圖8係不同類型末端之CCCA末端模體的圖。y軸以百分比形式顯示CCCA頻率。x軸顯示了發現CCCA末端模體之位置:5'突出鋸齒末端、3'突出鋸齒末端、鈍末端及所有片段。兩個條形圖顯示了健康病例及HCC病例。單獨分析了來自一個cfDNA片段之兩側末端。
如圖8所示,在HCC病例中,在cfDNA之5'突出鋸齒末端或3'突出鋸齒末端中,5' CCCA末端模體之頻率降低。對於鈍末端,與健康個體相比,HCC病例中5' CCCA末端模體之頻率增加。HCC病例及健康個體之間5' CCCA末端模體在5'突出鋸齒末端、3'突出鋸齒末端及鈍末端方面之頻率差異大於自所有片段末端推導的5' CCCA末端模體。圖8顯示,判定鋸齒末端之類型可提高區分HCC病例與健康病例之準確性。
圖9A及9B示出了一種技術,該技術可組合鋸齒末端、5'末端模體及3'末端模體,以量測cfDNA分子之末端形態之階段。在圖9A中,有一個具有5' 「CCCA」末端模體及3' 「TTTT」末端模體之5'突出鋸齒末端,末端模體之階段可被稱為「CCCA_TTTT」,其中5'末端模體後面係3'末端模體,兩者均用大寫字母表示,用下劃線(亦即「_」)作為分隔符。
在圖9B中,有一個具有5' 「CCCA」末端模體及3' 「GAGG」末端模體之3'突出鋸齒末端,聯合末端模體可被稱為「CCCA_gagg」,其中以大寫字母表示之5'末端模體後面係以小寫字母表示之3'末端模體。小寫表示3'末端為突出末端。可使用不同命名約定來顯示突出末端、非突出末端以及末端是否為鈍的。在一些實施例中,末端模體可僅包括來自一股的核苷酸,因為關於另一股的資訊可僅自一股推導出來。可使用分隔符來表示突出部分之位置。作為一個例子,圖9B可藉由「3-GAGG-GGGT」表示。「3」表示3'係突出的,且第2個「-」表示5'股末端開始的位置。
圖10A及10B示出了一種技術,該技術可組合來自片段兩側之鋸齒末端、5'末端模體及3'末端模體,以量測cfDNA分子之聯合末端形態。在圖10A中,存在此類DNA片段,其在左側具有帶有5' 「C」末端模體及3' 「G」 末端模體之5'突出鋸齒末端,且在右側具有帶有5' 「G」末端模體及3' 「T」末端模體之3'突出鋸齒末端。聯合末端模體可被稱為「5CG3GT」,其中前3個字元表示左末端,且隨後的3個字元表示右末端。
在圖10B中,存在此類DNA片段,其在左側具有帶有5' 「C」末端模體及3' 「T」末端模體之5'突出鋸齒末端,且在右側具有帶有5' 「A」末端模體及3' 「T」末端模體之鈍末端。聯合末端模體可被稱為「5CTBAT」,其中前3個字元表示左末端,且隨後的3個字元表示右末端。3個字母中之第一個字母表示鋸齒末端之類型,亦即「5」表示5'鋸齒末端,「3」表示3'鋸齒末端,且「B」表示鈍末端。三個字母中之第二個字母表示5'末端模體,且第三個字母表示3'末端模體。
圖11A係HCC及健康個體之間總的5'末端模體之頻率的相關性圖。y軸顯示了HCC個體之4-mer 5'末端模體之頻率。x軸顯示了健康個體之4-mer 5'末端模體之頻率。各點代表一個不同的4-mer末端模體。資料顯示高度相關性,R=0.98,且p<2.2e-16。具有偏離線y-x更遠的點的末端模體可用於區分HCC病例及健康病例。
圖11B係HCC及健康個體之間的階段性末端模體之頻率的相關性圖。y軸顯示了HCC個體之4-mer共存末端模體之頻率。x軸顯示了健康個體之4-mer共存末端模體之頻率。各點代表一個不同的共存末端模體,包括5'末端及3'末端之4-mer,區分5'突出端及3'突出端。資料顯示相關性,R=0.92,且p<2.2e-16。
圖11C係HCC及健康個體之間的聯合末端模體之頻率之相關性圖。y軸顯示了HCC個體之聯合末端模體之頻率。x軸顯示了健康個體之聯合末端模體之頻率。各點代表包括鋸齒末端類型之不同的聯合末端模體、來自cfDNA片段兩側之5'末端及3'末端之1-mer模體。資料顯示相關性,R=0.91,且p<2.2e-16。
與基於圖11A中之總體5'末端模體之典型分析相比,圖11B中之末端模體階段在HCC及健康個體之間顯示出更大的差異。在HCC及健康個體之間,總體5'末端模體中前4個模體之排序仍然相同。相反,前4個聯合末端模體之排序在很大程度上發生了變化。例如,健康個體之排序第一的聯合末端模體(CCCA_gagg)在HCC中下降至第4位,而健康個體中之排序第二的聯合末端模體(AAAA_TTTT)在HCC患者中上升至排序第一的聯合末端模體。HCC個體及健康個體之聯合末端模體的差異表明,不同的聯合末端模體或不同末端模體之組合可用於區分HCC病例及健康病例。
此外,與總體5'末端模體及聯合末端模體相比,聯合末端模體進一步擴大了HCC及健康個體之間的差異(圖11C)。在HCC及健康個體之間,總體5'末端模體中前4個模體之排序相同。儘管前4個聯合末端模體之排序發生了很大變化,但HCC (前4個聯合末端模體:AAAA_TTTT、CAAA_TTTT、CCCC_GGGT及CCCA_gagg)及健康個體(CCCA_gagg、AAAA_TTTT、CAAA_TTTT及CCCC_GGGT)之間的前4個聯合末端模體係相同的。相反,在HCC (前四個聯合末端模體:5CT5CT、5CG5CG、BCGBCG及5CA5CA)及健康個體(前四個聯合末端模體:BATBAT、BGCBGC、BATBGC及BGCBAT)之間,前4個聯合末端模體完全不同。HCC個體及健康個體之聯合末端模體之差異表明,鋸齒末端資訊、來自cfDNA片段兩側之不同末端模體的組合可用於區分HCC病例及健康病例。 B. 核酸酶活性
DNASE在cfDNA之片段化中起著不同的作用。鋸齒末端形態及/或末端模體可用於分析核酸酶活性。 1. 鋸齒末端形態
吾等先前研究表明不同的DNASE在cfDNA鋸齒末端產生中起著不同的作用。可藉由鋸齒末端推導DNASE活性(Ding等人. Clin Chem. 2022;68:917-926)。然而,先前僅分析了5'突出鋸齒末端而非3'突出鋸齒末端。所有類型之鋸齒末端(例如,5'突出鋸齒、3'突出鋸齒及鈍末端)之分析及單分子末端形態之並行分析可提供關於不同DNASEs活性的更多資訊。
圖12A-12F顯示了在PacBio平台(中值讀數:1,295,159;範圍:176,285-2,624,708)上使用單分子末端形態分析進行來自野生型(WT)、DNASE1 (DNASE1 -/-)、DNASE1L3 (DNASE1L3 -/-)及DFFB (DFFB -/-)敲除小鼠模型之血漿cfDNA樣本之分析。x軸顯示了核酸酶活性之分類。y軸顯示了特定鋸齒末端形態之頻率。
DNASE1 -/-小鼠顯示攜帶5'突出鋸齒末端之片段頻率的顯著降低(8.76%) (圖12A),且在DNASE1L3 -/-小鼠中可觀測到攜帶3'突出鋸齒末端之片段頻率的顯著減少(52.80%) (圖12B)。在DFFB -/-小鼠中可觀測到攜帶鈍末端之片段頻率的顯著降低(40.25%) (圖12C)。此等結果表明,與單獨分析5'突出鋸齒相比,分析所有類型之鋸齒末端可提供更多關於不同DNASEs活性之資訊。
吾等根據來自分子兩側之鋸齒末端形態(亦即5'突出鋸齒末端+ 3'突出鋸齒末端(5-3)、5'突出鋸齒末端+ 5'突出鋸齒末端(5-5)、3'突出鋸齒末端+ 3'突出鋸齒末端(3-3)、5'突出鋸齒末端+鈍末端(5-B)、3'突出鋸齒末端+鈍末端(3-B)、鈍末端+鈍末端(B-B)),對cfDNA片段進行進一步分類。如圖12D中所示,與DNASE1 -/-小鼠中5'突出鋸齒末端之頻率相比,可在攜帶5-5鋸齒末端之cfDNA片段之頻率中觀測到更大的降低(5-5鋸齒末端相對於5'突出鋸齒末端:15.40%相對於8.76%)。與DNASE1-/-小鼠相似,分別與DNASE1L3-/-小鼠(降低:3-3鋸齒末端相對於3'突出鋸齒末端:71.45%相對於52.80%) (圖12E)及DFFB-/-小鼠(降低:B-B鋸齒末端相對於鈍末端:70.41%相對於40.25%) (圖12F)中3'突出鋸齒末端及鈍末端之頻率相比,可在攜帶3-3鋸齒末端及B-B鋸齒末端之cfDNA片段之頻率中觀測到更大的降低。此等結果表明,一個cfDNA片段兩側之鋸齒末端之並行分析可提高不同DNASEs的不同活性的區分能力。該技術可用於增強DNASE活性異常疾病,諸如但不限於系統性紅斑狼瘡之診斷能力。 2. 末端模體及鋸齒末端形態
吾等先前出版物報導了cfDNA末端模體可用於推導不同DNASEs之活性(Han等人. Am J Hum Genet. 2020;106:202-214;Jiang等人. Cancer Discov. 2020;10:664-673)。前一節中所討論的結果表明,不同的DNASEs可能與各種類型之鋸齒末端有關。分析不同鋸齒末端組之末端模體可提高偵測DNASE活性變化之區分能力。
圖13係不同核酸酶活性之不同鋸齒末端形態及末端核苷酸類型的表。主要的列1304、1308及1312顯示了不同鋸齒末端之資料。主要的行1316、1320及1324顯示了所分析之不同核酸酶活性。各主要的列下的單個列顯示了主要的行中之野生型小鼠及特定核酸酶敲除小鼠的中值頻率,以及核酸酶敲除小鼠及野生型小鼠之間的中值頻率之相對變化。單個行指示終止核苷酸。灰色陰影之單元格指示不同鋸齒末端類型之間各終止核苷酸之最大變化。各行僅有一個加陰影之單元格。例如,對於DNASE1L3-/-小鼠,A端之最大變化改變在5'鋸齒末端中發現,因此5'鋸齒末端中A端之相對變化的小孔加有陰影。
如圖13所示,與具有3'突出鋸齒末端之片段及具有鈍末端之片段相比,與WT小鼠相比,具有5'突出鋸齒末端之片段在DNASE1L3 -/-小鼠中顯示出A- (中值增加:5'相對於3'相對於鈍的:39.28%相對於13.86%相對於25.68%)及G- (中值增加:5'相對於3'相對於鈍的:21.55%相對於4.79%相對於4.79%) 5'末端模體的最大增加。與具有5'突出鋸齒末端之片段及具有3'突出鋸齒末端之片段相比,與WT小鼠相比,具有鈍末端之片段在DNASE1L3 -/-小鼠中顯示出C- (中值降低:5'相對於3'相對於鈍的:18.83%相對於4.25%相對於21.60%)及T- (中值降低:5'相對於3'相對於鈍的:41.44%相對於10.23%相對於77.99%) 5'末端模體的最大降低。在DNASE1 -/-小鼠中,與WT小鼠相比,具有鈍末端之片段顯示出5' C端(中值降低:5'相對於3'相對於鈍的:9.67%相對於0.40%相對於13.70%)及5' T端(中值降低:5'相對於3'相對於鈍的:7.68%相對於1.64%相對於45.90%)之最大的降低及5' A端(中值增加:5'相對於3'相對於鈍的:11.43%相對於2.18%相對於19.69%)之最顯著的增加,而5'突出鋸齒末端顯示出5' G端(中值增加:5'相對於3'相對於鈍的:11.03%相對於-1.74%相對於-0.29%)之最大的增加。有趣的是,對於DFFB -/-小鼠,已在具有鈍末端之片段中觀測到5'末端模體之最大的變化(5' C端(中值降低:5'相對於3'相對於鈍的:4.16%相對於-0.80%相對於33.73%);5' T端(中值降低:5'相對於3'相對於鈍的:22.57%相對於1.48%相對於110.94%);5' A端(中值降低:5'相對於3'相對於鈍的:15.43%相對於2.50%相對於28.12%);5' G端(中值降低:5'相對於3'相對於鈍的:4.70%相對於-2.35%相對於8.68%))。吾等進一步分析了DFFB -/-及WT小鼠中所有片段、具有5'突出鋸齒末端、3'突出鋸齒末端之片段,以及具有鈍末端之片段中的4-mer 5'末端模體。
圖14A-14D係DFFB -/-(DFFB敲除[KO])小鼠及野生型(WT)小鼠之末端模體排序的圖。圖在x軸上具有野生型小鼠中之末端模體排序,且DFFB -/-小鼠中之末端模體排序在y軸上。圖14A顯示了DFFB -/-小鼠及野生型小鼠中合併之所有cfDNA片段之5'末端模體排序。圖14B顯示了DFFB -/-小鼠及野生型小鼠中攜帶5'突出鋸齒末端之經合併之cfDNA片段的5'末端模體排序。圖14C顯示了DFFB -/-小鼠及野生型小鼠中攜帶3'突出鋸齒末端之經合併之cfDNA片段的5'末端模體排序。圖14D顯示了DFFB -/-小鼠及野生型小鼠中攜帶鈍末端之經合併之cfDNA片段的5'末端模體排序。如圖14A-14D中所示,與所有片段、具有5'突出鋸齒末端之片段及具有3'突出鋸齒末端之片段相比,可在具有鈍末端之片段中觀測到DFFB -/-及WT小鼠之間的最大差異(R:所有相對於5'相對於3'相對於鈍的:0.94相對於0.95相對於1相對於0.77)。然而,具有5'突出鋸齒末端之片段亦具有DFFB -/-小鼠中過度代表的(overrepresented)或代表不足的(underrepresented)末端模體。
此等資料表明,單分子末端形態之並行分析允許更精確地破譯歸因於血漿中各種DNA核酸酶之特徵切割。 C. 示例性方法
可使用本文所描述之任何過程來判定病況之等級。實例可包括在判定患者中之疾病或病況等級之後治療患者中的疾病或病況。治療可包括任何適合之療法、藥物或手術,包括本文所提及之參考文獻中描述的任何治療。參考文獻中關於治療的資訊藉由引用併入本文中。
可根據判定之癌症等級、判定之突變及/或起源組織來提供治療。例如,可用特定藥物或化學療法靶向已識別之突變(例如,對於多態性實施例)。起源組織可用於指導手術或任何其他形式之治療。且癌症之等級可用於判定任何類型之治療的侵襲性,此亦可基於癌症之等級來判定。
可分析統計上顯著數量之游離DNA分子,以便提供來自第一組織類型之比例所貢獻的準確測定。在一些實施例中,分析至少1,000個游離DNA分子。在一些實例中,分析至少1,000個游離DNA分子。在其他實施例中,可分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000個游離DNA分子或更多。 1. 來自 並行分析之鋸齒末端
圖15係分析獲自個體之生物樣本之示例性過程1500的流程圖。生物樣本可包括複數個核酸分子。核酸分子可係游離及雙股的,具有第一股及第二股。核酸分子中之至少一種可具有突出部分,其中第一股或第二股與另一股重疊。過程1500可使用來自核酸分子之兩股之四個末端的突出部分資訊,以判定個體病況之等級。在一些實施例中,可藉由系統10或系統2400執行圖15之一或多個過程方框。
在方框1502處,對於複數個核酸分子中之各核酸分子,量測了核酸分子第一末端特性之第一股特異性的分類。股特異性之分類可指示第一股或第二股是否突出於另一股之外,包括若沒有股突出於另一股之外。股特異性之分類可識別第一股或第二股是否係3'股或5'股。股特異性之分類亦可指示第一股或第二股之突出部分之長度。股特異性之分類可包括本文所描述之鋸齒末端形態。可使用過程300量測特性。
對於複數個核酸分子中之各核酸分子,可量測核酸分子第二末端之第二股特異性之分類。
在方框1504處,使用複數個核酸分子之第一股特異性之分類判定鋸齒末端值。鋸齒末端值可係具有某一類型之鋸齒末端,包括5'突出部分、3'突出部分及鈍末端之核酸分子之量(例如,圖5A)。量可係數目、總長度、品質或頻率。在一些實施例中,鋸齒末端值可係核酸分子之量,包括來自以下分類之一的量:第一末端之鈍末端及第二末端之鈍末端、第一末端之5'突出部分及第二末端之鈍末端、第一末端之3'突出部分及第二末端之鈍末端、第一末端之5'突出部分及第二末端之3'突出部分、第一末端之5'突出部分及第二末端之5'突出部分,以及第一末端之3'突出部分及第二末端之3'突出部分(例如,圖5B)。可使用第二股特異性的分類來判定鋸齒末端值。
在一些實例中,鋸齒末端值可係向量中之元素。向量可包括複數個元素。複數個元素可包括以下分類中之一項或多項中之核酸分子的量:第一末端之鈍末端及第二末端之鈍末端、第一末端之5'突出部分及第二末端之鈍末端、第一末端之3'突出部分及第二末端之鈍末端、第一末端之5'突出部分及第二末端之3'突出部分、第一末端之5'突出部分及第二末端之5'突出部分,以及第一末端之3'突出部分及第二末端之3'突出部分。
複數個元素可包括具有一或多個長度範圍內之長度之核酸分子的分類(例如,圖5B及5C)。一或多個長度範圍可係本文所描述之任何長度範圍。長度範圍可包括小於或大於以下任何長度之長度:90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340或350。另外,長度範圍可包括在本文所描述之任意兩個長度之間且包括本文所描述之任意兩個長度的長度。各核酸分子之長度可藉由將對應於相應核酸分子末端之子序列與參考基因體進行比對來判定。
鋸齒末端值可包括在一個突出部分分類中且具有在某一長度範圍內之長度之核酸分子的量與具有相同突出部分分類的具有在不同長度範圍內之長度之核酸分子的量的比率。向量可包括複數個突出部分分類中之各分類的長度比率(例如,圖7A)。
在方框1506處,將鋸齒末端值與參考值進行比較。比較可判定鋸齒末端值是否在統計學上與參考值顯著不同。參考值可係本文所描述之任何參考值。可將向量與參考向量(其可包括複數個不同參考值)進行比較。比較可在向量中之對應元素之間進行。在一些實施例中,可藉由機器學習模型來執行比較。例如,可使用自患有已知等級之病況之個體判定的鋸齒末端值來訓練機器學習模型。
在方框1508處,使用比較來判定個體之病況等級。病況可係癌症、自體免疫性疾病、妊娠相關病症、核酸酶活性缺陷或本文所描述之任何病況。可自患有某一等級之病況之一或多名個體或者一或多名健康個體中判定參考值。若鋸齒末端值在統計學上與參考值相同,則可將病況之等級判定為與參考值相關聯之一或多名個體相同。
在一些實例中,病況之等級未判定。相反,可使用比較來判定臨床相關DNA之濃度分數。可自具有臨床相關DNA之已知濃度分數之一或多名個體中判定參考值。參考值可係使用校準樣本判定之校準值。
過程1500可包括額外的實施例,如本文所描述之任何單一實施例或實施例之任何組合及/或結合本文其他地方所描述之一或多個其他過程。
儘管圖15顯示了過程1500之示例性方框,但在一些實施例中,過程1500可包括與圖15中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程1500之兩個或更多個方框可並行執行。 2. 一端的末端模體
圖16係分析自個體獲得之生物樣本之示例性過程1600的流程圖。生物樣本可包括複數個核酸分子。核酸分子可係游離的及雙股的,具有第一股及第二股。過程1600可使用至少在分子一端之末端模體來判定病況之等級。複數個核酸分子中之至少一些核酸分子在一股上具有核苷酸,其在另一股上無互補部分。在一些實施例中,圖16之一或多個過程方框可藉由系統10或系統2400執行。
在方框1602處,對於複數個核酸分子中之各核酸分子,判定了核酸分子第一末端之第一股之第一序列末端模體。
在方框1604處,判定了核酸分子之第一末端之第二股之第二序列末端模體。在實例中,第一股在第一末端可具有5'末端。在其他實例中,第一股在第一末端可具有3'末端。第一股可突出於第二股之外,或者第二股可突出於第一股之外。第一末端可係鈍末端。可使用過程300判定子序列。在一些實施例中,可藉由採用第一股中之相應核苷酸之互補核苷酸來判定第二股之第二序列末端模體。
在方框1606處,判定了在第一末端具有第一序列末端模體及第二序列末端模體之第一組合之核酸分子的第一量。序列末端模體可具有2、3、4、5、6、7、8、9或10個核苷酸。量可係數目、總長度、質量或頻率。第一組合可係關於圖9A及圖9B描述之階段性末端模體。
在方框1608處,使用第一量生成末端模體參數之值。在一些實施例中,末端模體參數可係第一量。在一些實施例中,末端模體參數可係第一量與其他量(例如,所有末端模體之量)之比率。作為一個例子,末端模體參數可係頻率。
除了第一階段性末端模體,亦可使用第二階段性末端模體。可判定在第一末端具有第三序列末端模體及第四序列末端模體之第二組合的核酸分子的第二量。第三序列末端模體可在5'股或3'股處。作為一個例子,第一量可係AAAA_TTTT之量,且第二量可係CCCA_gagg之量。可使用第二量生成末端模體參數之值。末端模體參數可係不同量之末端模體之某些組合的向量。
在方框1610處,將末端模體參數之值與參考值進行比較。參考值可係本文所描述之任何參考值。比較可係本文所描述之任何比較,包括關於方框1506所描述的。
在方框1612處,使用比較判定個體病況之等級。可類似於方框1508來執行判定。
病況可係癌症、HCC、自體免疫性疾病、妊娠相關之病症、核酸酶活性缺陷或本文所描述之任何病況。可自患有某一等級之病況之一或多名個體或者一或多名健康個體判定參考值。
在一些實例中,病況的等級未判定。相反,可使用比較來判定臨床相關DNA之濃度分數。可自具有臨床相關DNA之已知濃度分數之一或多名個體中判定參考值。參考值可係使用校準樣本判定之校準值。
過程1600可包括使用來自分子另一端之鋸齒末端之兩個序列模體。可使用來自同一分子之四個序列模體。在實施例中,複數個核酸分子係第一複數個核酸分子。生物樣本可包括第二複數個核酸分子。第一複數個核酸分子可包括第二複數個核酸分子之子集。過程1600可進一步包括對於第二複數個核酸分子中之各核酸分子,在核酸分子之第二末端判定在第二股上無互補部分的第一股上的第三序列末端模體,以及在核酸分子之第二末端判定第二股上的第四序列末端模體。可判定在第二末端具有第三序列末端模體及第四序列末端模體之第二組合的核酸分子的第二量。可使用第二量生成末端模體參數之值。在一些實施例中,末端模體參數之值可係具有分子上存在的四個序列模體的某一組合之分子的量。
在一些實施例中,一端之鋸齒末端形態亦可用於判定病況之等級。過程1600可包括對於複數個核酸分子中之各核酸分子,量測核酸分子第一末端特性之第一股特異性之分類。股特異性之分類可指示第一股或第二股是否突出於另一股之外。例如,在一端,股特異性之分類可指示3'突出末端、5'突出末端、鈍末端或鋸齒末端(通常)。判定第一量可包括判定具有第一組合及第一股特異性之分類之核酸分子的第一量。
在一些實施例中,亦可使用第二末端之鋸齒末端形態。過程1600可包括對於複數個核酸分子中之各核酸分子,量測核酸分子第二末端之第二股特異性之分類。判定第一量可包括判定具有第一組合、第一股特異性之分類及第二股特異性之分類之核酸分子的第一量。
過程1600可包括額外的實施例,如本文所描述之任何單一實施例或實施例之任何組合及/或結合本文其他地方所描述之一或多個其他過程。
儘管圖16顯示了過程1600之示例性方框,但在一些實施例中,過程1600可包括與圖16中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程1600之兩個或更多個方框可並行執行。 3. 3' 末端末端模體
圖17係分析獲自個體之生物樣本之示例性過程1700的流程圖。生物樣本可包括複數個核酸分子。核酸分子可係游離的及雙股的,具有第一股及第二股。過程1700可使用至少在分子之一端之末端模體,以判定病況之等級。複數個核酸分子中之至少一些核酸分子在一股上具有在另一股上無互補部分的核苷酸。在一些實施例中,圖17之一或多個過程方框可藉由系統10執行。
在方框1702處,對於複數個核酸分子中之各核酸分子,判定了股的在核酸分子之第一末端的第一序列末端模體,其中第一末端係股的3'末端。第一序列末端模體係原始分子之真實末端模體而非在分子被末端鈍化後3'末端之末端模體,藉由在3'股上在核苷酸中填充,或者藉由移除3'股上的核苷酸。可使用過程300判定第一序列末端模體。
在方框1704處,判定了在第一末端具有第一序列末端模體之核酸分子的第一量。第一量可係絕對或相對量。
可判定單一股兩端之序列末端模體。在一些實例中,過程1700可包括對於複數個核酸分子中之各核酸分子,在核酸分子第二末端判定股之第二序列末端模體。第一量係在第一末端具有第一序列模體且在第二末端具有第二序列末端模體之核酸分子。
在一些實施例中,可判定單一股之長度。可將單一股之兩端與參考基因體進行比對以判定長度。亦可判定互補股之長度。可使用兩種長度來生成兩股之間的長度差。可判定複數個分子之兩股之間的長度差的統計值,且將其與參考值進行比較。比較可用於判定病況之等級。亦可藉由加上或減去分子各端之突出部分長度來判定長度差,而不需要判定任何一股之長度。
在方框1706處,使用第一量生成末端模體參數之值。在一些實施例中,末端模體參數可係第一量與其他量(例如,所有末端模體之量)之比率。作為一個例子,末端模體參數可係頻率。
在方框1708處,將末端模體參數之值與參考值進行比較。參考值可係本文所描述之任何參考值。例如,可自個體之患有已知等級病況之校準樣本判定參考值。
在方框1710處,使用比較判定個體病況之等級。
在一些實施例中,可使用單一分子兩個3'末端之末端模體。股可係第一股。末端模體參數可係第一末端模體參數。參考值可係第一參考值。過程1700亦可包括對於複數個核酸分子中之各核酸分子,判定核酸分子第二末端之第二股之第二序列末端模體。第二末端係第二股之3'末端。過程1700可包括判定在第二末端具有第二序列末端模體之核酸分子的第二量。可使用第二量生成第二末端模體參數之值。可將第二末端模體參數之值與第二參考值進行比較。可使用比較判定病況之等級。
在一些實施例中,一端之鋸齒末端形態亦可用於判定病況之等級。過程1700可包括對於複數個核酸分子中之各核酸分子,量測核酸分子第一末端特性之第一股特異性之分類。股特異性之分類可指示第一股或第二股是否突出於另一股之外。例如,在一端,股特異性之分類可指示3'突出末端、5'突出末端、鈍末端或鋸齒末端(通常)。第一(或第二)股特異性之分類可係來自可能股特異性分類之清單之特定鋸齒末端形態。判定第一量可包括判定具有第一組合及第一股特異性之分類之核酸分子的第一量。
在一些實施例中,亦可使用第二末端之鋸齒末端形態。過程1700可包括對於複數個核酸分子中之各核酸分子,量測核酸分子第二末端之第二股特異性的分類。判定第一量可包括判定具有第一組合、第一股特異性之分類及第二股特異性之分類之核酸分子的第一量。
過程1700可包括額外的實施例,如本文中描述之任何單一實施例或實施例之任何組合及/或結合本文其他地方描述之一或多個其他過程(例如,過程1600)。
儘管圖17顯示了過程1700之示例性方框,但在一些實施例中,過程1700可包括與圖17中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程1700之兩個或更多個方框可並行執行。 III. 富集
某些類型之DNA,包括臨床相關之DNA,可能在具有某些鋸齒末端形態或序列末端模體之DNA中傾向於被更大地代表。因此,富集某些鋸齒末端形態及/或序列末端模體可能導致富集某些類型之臨床相關DNA之樣本。富集可包括樣本之物理富集或自分析生物樣本獲得之讀數的電腦富集。 A. 鋸齒末端
為了探索單分子末端形態並行分析在非侵入性產前測試(NIPT)中之潛在應用,對母體血漿中胎兒特異性的及共有的cfDNA片段中之末端形態進行了分析。藉由使用基於微陣列之基因分型技術(HumanOmni2.5基因分型陣列Illumina)獲得的關於母體血沉棕黃層及胎盤組織樣本之基因型定義了胎兒特異性的及共有的cfDNA片段。鑑定了資訊性SNPs (亦即其中母親為純合型(表示為AA基因型),且胎兒為雜合型(表示為AB基因型))。根據在資訊性SNP位點攜帶胎兒特異性對偶基因之DNA片段鑑定了胎兒特異性之DNA片段。在此情況下,B對偶基因係胎兒特異性的,且攜帶B對偶基因之DNA片段經推導來源於胎兒組織。根據在資訊性SNP位點處攜帶共有的對偶基因之DNA片段來鑑定共有的DNA片段。在該情況下,A對偶基因係共有的,且攜帶A對偶基因之DNA片段經推導來源於胎兒及母體組織(主要來自母體組織)。判定了攜帶胎兒特異性對偶基因(B)之胎兒特異性分子的數目(p)。判定了攜帶共有的對偶基因(A)之分子的數目(q)。所有游離DNA樣本間的胎兒DNA濃度分數將藉由2p/(p+q)*100%來計算。
圖18A-18C顯示了在PacBio定序平台上對總共10個孕婦血漿DNA樣本之單分子末端形態之並行分析(讀數的中值數目:1,305,115;範圍:393,197-1,921,070)。
圖18A係5'突出鋸齒末端之頻率圖。y軸顯示了以百分比表示之5'突出鋸齒末端之頻率。x軸顯示了攜帶共有對偶基因之片段及攜帶胎兒特異性對偶基因之片段。與共有cfDNA相比,胎兒特異性cfDNA攜帶更多的5'突出鋸齒末端(共有的相對於胎兒特異性的:中值:52.0%相對於59.2%)。
圖18B係3'突出鋸齒末端之頻率圖。y軸顯示了以百分比表示之3'突出鋸齒末端之頻率。x軸顯示了攜帶共有對偶基因之片段及攜帶胎兒特異性對偶基因之片段。與共有cfDNA相比,胎兒特異性cfDNA攜帶更多的3'突出鋸齒末端(共有的相對於胎兒特異性的:中值:23.0%相對於33.5%)。
圖18C係鈍末端之頻率圖。y軸顯示了以百分比表示之鈍末端之頻率。x軸顯示了攜帶共有對偶基因之片段及攜帶胎兒特異性對偶基因之片段。與共有cfDNA相比,胎兒特異性cfDNA攜帶更少的鈍末端(共有的相對於胎兒特異性的:中值:23.5%相對於8.7%)。
圖18D顯示了基於不同末端形態之胎兒DNA濃度分數百分比。y軸顯示了以百分比表示之胎兒DNA濃度分數。x軸顯示了不同末端形態。與所有cfDNA片段相比,攜帶5'突出鋸齒末端(5'突出鋸齒末端相對於所有片段:中值:16.61%相對於15.41%)或3'突出鋸齒末端(3'突出鋸齒末端相對於所有片段:中值:17.94%相對於15.41%)之cfDNA之選擇性分析顯示胎兒DNA濃度分數的顯著增加。相反,攜帶鈍末端之cfDNA之選擇性分析(鈍末端相對於所有片段:中值:5.88%相對於15.41%)顯示,與所有cfDNA片段相比,胎兒DNA濃度分數顯著降低,此確實表明母體來源之DNA分數顯著增加。圖18A-18D顯示鋸齒末端之類型可用於富集特定來源之DNA。
在另一實施例中,根據來自分子兩側之鋸齒末端形態,cfDNA片段被分類為6個不同的組(例如,5'突出鋸齒末端+ 3'突出鋸齒末端(5-3)、5'突出鋸齒末端+ 5'突出鋸齒末端(5-5)、3'突出鋸齒末端+ 3'突出鋸齒末端(3-3)、5'突出鋸齒末端+鈍末端(5-B)、3'突出鋸齒末端+鈍末端(3-B)、鈍末端+鈍末端(B-B))。
圖19係胎兒DNA濃度分數相對於不同鋸齒末端形態之圖。y軸顯示了自cfDNA片段推導之胎兒DNA濃度分數。x軸顯示了不同末端形態(例如,5'突出鋸齒末端及3'突出鋸齒末端(5-3)、5'突出鋸齒末端及5'突出鋸齒末端(5-5)、3'突出鋸齒末端及3'突出鋸齒末端(3-3)、5'突出鋸齒末端及鈍末端(5-B)、3'突出鋸齒末端及鈍末端(3-B)、鈍末端及鈍末端(B-B))及所有片段。屬於3-3 (3-3相對於所有片段:中值:23.48%相對於15.41%)、5-3 (5-3相對於所有片段:中值:19.50%相對於15.41%)及5-5 (5-5相對於所有片段:中值:17.93%相對於15.41%)組之cfDNA之選擇性分析顯示胎兒DNA濃度分數相比所有cfDNA片段的顯著增加。相反,與所有cfDNA片段相比,屬於3-B (3-B相對於所有片段:中值:9.12%相對於15.41%)、5-B (5-B相對於所有片段:中值:8.17%相對於15.41%)及B-B (B-B相對於所有片段:中值:2.53%相對於15.41%)組之cfDNA之選擇性分析顯示胎兒DNA濃度分數的顯著減少。此等結果表明來自cfDNA片段兩側之鋸齒末端形態之分析可富集臨床相關之DNA。 B. 鋸齒末端及末端模體 之並行分析
單分子末端形態之並行分析(例如,組合末端模體與鋸齒末端)可富集母體血漿中之胎兒DNA。吾等將上文所提及之10名孕婦中所有定序的讀數(讀數:12,142,332)合併在一起。
圖20A及20B係自具有某些鋸齒末端形態及序列末端模體之片段推導之胎兒DNA濃度分數的圖。圖的y軸係自cfDNA片段推導之胎兒DNA濃度分數。x軸顯示了片段之不同分類:所有片段、鋸齒末端形態、末端模體以及鋸齒末端形態及末端模體之組合。
圖20A顯示了與所有片段(胎兒DNA濃度分數:16.3%)相比胎兒DNA濃度分數實質性增加的在片段之任一側上攜帶5'突出鋸齒末端以及5' CCG末端模體之片段(胎兒DNA濃度分數:29.3%)、僅具有5'突出鋸齒末端之片段(胎兒DNA濃度分數:18.5%),或者僅具有CCG 5'末端模體之片段(胎兒DNA濃度分數:25.2%)。
圖20B顯示了與所有片段(胎兒DNA濃度分數:16.3%)相比胎兒DNA濃度分數實質性增加的在片段之任一側上攜帶3'突出鋸齒末端以及5' GCG末端模體之片段(胎兒DNA濃度分數:35.6%)、僅具有3'突出鋸齒末端之片段(胎兒DNA濃度分數:21.2%),或者僅具有GCG 5'末端模體之片段(胎兒DNA濃度分數:16.2%)。此等結果表明,在同一末端的鋸齒末端及末端模體之並行分析可促進母體血漿中胎兒DNA之富集。單分子末端形態之並行分析可促進NIPT。 C. 示例性方法
圖21係針對臨床相關之DNA富集生物樣本之示例性過程2100的流程圖。生物樣本可包括臨床相關之DNA及其他DNA。複數個核酸分子中之各核酸分子係雙股,具有第一股及第二股。臨床相關之DNA可係腫瘤DNA、移植DNA或胎兒DNA。生物樣本可獲自懷有胎兒之女性個體,且臨床相關之DNA可係胎兒DNA或母體DNA。在一些實施例中,可藉由系統2400執行圖21之一或多個過程方框。
在方框2110處,針對複數個核酸分子中之各核酸量測了核酸分子第一末端之第一股特異性之分類。股特異性之分類指示第一股或第二股是否突出於另一股之外。股特異性之分類可包括突出於第二股之外的第一股、突出於第一股之外的第二股及/或兩股均不突出於另一股之外(鈍末端)。核酸分子之子集具有的第一股特異性之分類可為第一股突出於第二股之外。第一股可係3'股或5'股。在一些實施例中,核酸分子子集之第一股特異性之分類指示核酸分子之第一股突出於第二股之外,且核酸分子子集之第二股特異性之分類指示核酸分子之第二股突出於第一股之外。例如,5'末端可在兩端突出。
在方框2120處,選擇對應於具有第一股特異性之分類之核酸分子子集的讀數以形成富集之樣本。富集之樣本可係富集之電腦樣本。在一些實施例中,富集之樣本可藉由物理富集技術形成。例如,根據一些實施例,可使用基於鋸齒末端特異性雜交之靶向捕獲來富集某一數量之目標鋸齒末端。在物理富集分析之一實施例中,可使用基於鋸齒末端特異性雜交之靶向捕獲來富集目標鋸齒末端。設計了可與目標鋸齒末端特異性雜交之生物素化RNA探針。與生物素化探針雜交之目標鋸齒末端可被股黴親及素包被之磁珠拉下。RNA探針將被核糖核酸酶如RNA酶H降解。目標鋸齒狀末端將在下拉材料中富集。在一實施例中,一起分析一或多種不同之鋸齒末端,例如,對於實際應用,不同鋸齒末端之讀出之間的比率或偏差。
在一些實施例中,複數個核酸分子中之各核酸分子之核酸分子第二末端之第二股特異性的分類。核酸分子子集可具有第二股特異性之分類。例如,富集之樣本可包括分子,其在一端具有一些類型之突出部分,且在另一端具有相同類型之突出部分。
在實施例中,可針對複數個核酸分子中之各核酸分子判定核酸分子第一末端之第一序列末端模體。選擇對應於核酸分子子集之讀數可包括選擇對應於具有第一序列末端模體之核酸分子之讀數。
在實施例中,可針對複數個核酸分子中之各核酸分子判定核酸分子第二末端之第二序列末端模體。選擇對應於核酸分子子集之讀數可包括選擇對應於具有相同的第二序列末端模體之核酸分子之讀數。
在一些實施例中,方法亦可包括分析核酸分子子集以判定病症等級之分類。例如,方法可包括將子集之讀數與參考基因體進行比對。可執行甲基化感知定序或其他偵測技術來判定甲基化水平或甲基化模式(例如,一或多個基因體位點處的甲基化狀態)。可將甲基化水平或甲基化模式與患有已知等級病症之對照樣本之參考水平或模式進行比較。可使用比較來判定病症之等級。
在一些實施例中,方法可包括判定染色體畸變或胎兒單倍型。可將子集之讀數與參考基因體進行比對。可自比對中鑑定染色體畸變(例如,擴增或缺失)或胎兒單倍型。
在實施例中,過程2100亦可包括判定讀數的第一量。可使用讀數的第一量判定第一參數。可使用序列讀數的第一量及另一量(例如,讀數或具有某一股特異性分類或序列末端模體之讀數的總量)判定第一參數。在一些實例中,該兩種量均可係單獨的參數。其他量可採用不同的形式,例如,對應於分析之序列讀數及/或DNA分子之總數。第一參數可係量之比率。
可使用第一參數判定生物樣本之特徵。第一特徵可係生物樣本中臨床相關DNA分子之濃度分數。生物樣本之特徵可係生物樣本中畸變之水平。藉由將第一參數與自特徵值已知之一或多個校準樣本判定的一或多個校準值進行比較來估計生物樣本特徵之第一值。
因此,基於相應核酸酶生成之參數可用於判定生物樣本之特徵。此等相應參數可被組合以形成新的組合參數,例如,作為比率、相應參數的相應函式之比率,以及作為諸如機器學習模型之更複雜函式的兩個輸入。示例性組合參數可包括DNASE1L3/DFFB、DNASE1/DFFB或DNASE1L3: DNASE1: DFFB之其他比率。此外,可使用超過兩種核酸酶之參數,例如,可使用3種或更多種核酸酶之相對參數。
在一些實施例中,基於分析一組參數來估計生物樣本特徵之第一值,其中各參數對應於與另一量(例如,用於標準化)組合之序列讀數的量,各序列讀數包括與特定序列末端特徵對應的終止序列。例如,參數可包括兩組序列讀數與其相應的末端特徵之間的頻率比的特定組合。例如,該組參數中之第一參數可對應於第一量之序列讀數及另一量之序列讀數之間的股特異性分類的比率,各序列讀數包括對應於第一核酸酶之股特異性之分類的股特異性的分類,且該組參數中之第二參數可對應於第二量之序列讀數及第三量之序列讀數之間的股特異性的分類的比率,各序列讀數包括對應於第二核酸酶之末端特徵之股特異性的分類。在一些情況下,序列讀數的第三量係用於判定第一參數之序列讀數的另一量。
所判定之特徵可包括孕齡或範圍(例如,8週或9-12週),例如,當核酸酶在胎兒組織及母體組織之間被差異調節時。在另一個例子中,所判定之特徵可係相對於其他組織類型(例如,造血細胞)之特定組織類型(例如,肝細胞)。目標組織類型之特徵亦可指示目標組織類型之特定病況(例如,HCC、子癇前期、早產)。在另一個例子中,所判定之特徵可係與特定組織類型(例如,肝細胞)相對應的器官的尺寸或營養狀態。在又一個例子中,所判定之特徵可包括生物樣本中臨床相關DNA之分數。
可對複數個校準值進行比較。可藉由將第一參數輸入至適合於校準資料之校準函式中來進行比較,該校準函式提供第一參數相對於樣本中特徵變化之變化。作為另一個例子,一或多個校準值可對應於一或多個校準樣本中之其他參數。
通常,較佳使用與用於生物(測試)樣本類似的測定來生成自一或多個校準樣本判定之一或多個校準值。例如,可以相同的方式生成定序文庫。
過程2100可包括額外的實施例,如本文所描述之任何單一實施例或實施例之任何組合及/或結合本文其他地方或US 2022/0010353 A1中所描述之一或多個其他過程,該專利出於所有目的以全文引用之方式併入本文中。
儘管圖21顯示了過程2100之示例性方框,但在一些實施例中,過程2100可包括與圖21中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程2100之兩個或更多個方框可並行執行。 IV. 臨床相關 DNA分數
本案,包括章節II.B中所描述之結果,表明了不同鋸齒末端類型與不同DNASEs活性之間的關係。5'突出鋸齒已被揭露與DNASE1之活性相關,且鈍末端已被揭露與DFFB之活性相關。由於不同DNASE在不同組織中之表現不同,鋸齒末端特徵可用於推斷cfDNA之來源組織。
圖22A係白細胞及胎盤中DNASE1之mRNA表現水平的圖。y軸顯示RPKM,此係自RNA定序結果推導出的標準化基因表現單元,亦即每百萬個定序讀數每千鹼基之讀數(Trapnell等人. Nat Biotechnol. 2010; 28: 511-5)。x軸顯示白細胞及胎盤。
圖22B係白細胞及胎盤中DFFB之mRNA表現水平的圖。軸與圖22A相同。
圖22C係胎兒DNA濃度分數及攜帶5'突出鋸齒末端之cfDNA片段頻率之間的相關性圖。x軸顯示了基於SNP之胎兒DNA濃度分數。y軸顯示了5'突出鋸齒末端之頻率。
圖22D係胎兒DNA濃度分數及攜帶鈍末端之cfDNA片段頻率之間的相關性圖。x軸顯示了基於SNP之胎兒DNA濃度分數。y軸顯示了鈍末端之頻率。
如圖中所示,相比白細胞,胎盤組織顯示更高的DNASE1表現(圖22A)及更低的DFFB表現(圖22B)。更高的DNASE1與更高的5'突出鋸齒末端相關,且更低的DFFB與更少的來自胎盤來源片段之鈍末端相關。5'突出鋸齒末端及鈍末端之頻率可用於反映胎兒DNA濃度分數。圖22C顯示了與胎兒DNA濃度分數成正相關的5'突出鋸齒末端之頻率,而圖22D顯示了與胎兒DNA成負相關的鈍末端之頻率。此進一步表明血漿DNA之鋸齒末端模式可反映彼等分子之來源組織。
圖23係用於判定生物樣本中之臨床相關DNA分數之示例性過程2300的流程圖。生物樣本可包括多種游離之核酸分子。複數個核酸分子中之各核酸分子可係具有第一股及第二股之雙股。生物樣本可獲自個體。複數個核酸分子中之至少一些核酸分子在一股上具有在另一股上無互補部分之核苷酸。生物樣本可係本文中所描述之任何生物樣本。在一些實施例中,可藉由系統2400執行圖23之一或多個過程方框。
臨床相關之DNA可係來自組織類型之胎兒DNA、腫瘤DNA或DNA。組織類型可包括胎盤、肝、白細胞、結腸、腎、肺或本文所描述之任何其他組織類型。
在方框2310處,至少兩個不同的步驟係可能的。第一,可針對複數個核酸分子中之各核酸分子量測核酸分子第一末端之第一股特異性之分類。股特異性之分類可指示第一股或第二股是否突出於另一股之外,其中第一股係3'股。其次,可針對複數個核酸分子中之各核酸分子判定存在於核酸分子第一末端之第一序列末端模體及存在於核酸分子第二末端之第二序列末端模體。序列末端模體可具有突出部分及/或鈍末端。
在方框2320處,可判定具有突出於第二股之外的第一股之第一股特異性之分類之核酸分子的第一量,或者可判定第一序列末端模體的第二量及第二序列末端模體的第三量。
在方框2330處,可判定使用第一量或者第二量及第三量之參數。例如,過程可包括判定第一量,且判定參數可使用第一量。作為另一個例子,過程可包括判定第二量及第三量,其中判定參數使用第二量及第三量。
在一些實施例中,除了3'突出末端之量,亦可使用5'突出末端之量。例如,過程2300亦包括判定第一量,以及判定具有突出於第一股之外的第二股之相同的第一股特異性分類之核酸分子的第四量,其中判定參數使用第一量及第四量。
在一些實施例中,除了3'突出末端之量及/或鈍末端之量,亦可使用鈍末端之量。例如,過程2300亦包括判定具有與第二股平齊的第一股之相同的第一股特異性分類之核酸分子的第五量,其中判定參數使用第一量、具有突出於第一股之外的第二股之分子的第四量及第五量。
在一些實施例中,可使用核酸分子兩端之突出末端。例如,過程2300亦可包括對於複數個核酸分子中之各核酸分子,量測核酸分子第二末端之第二股特異性之分類。過程亦可包括判定具有相同的第二股特異性分類之核酸分子的第四量,其中判定參數使用第一量及第四量。
在一些實施例中,可使用第一股特異性之分類、第一序列末端模體及第二序列末端模體。例如,過程可包括判定第一量、第二量及第三量。判定參數亦可包括使用第一量、第二量及第三量。
在一些實施例中,參數可包括量之向量。向量可包括本文所描述之任何向量的元素,包括明確突出部分上的不同組合的元素。判定參數可包括使用除了所提及之具體量以外的量。例如,參數可係與所有核酸分子之量的比率或差異。
在方框2340處,可將參數與參考值進行比較。可類似於本文中,包括方框1508所描述之任何組合來執行比較。參考值可係自具有已知分數之臨床相關DNA之一或多個對照樣本判定的值。機器學習模型可用於執行參數與參考值之比較。機器學習模型可包括線性回歸、邏輯回歸、深度循環神經網路、貝葉斯分類器、隱馬爾可夫模型(HMM)、線性判別分析(LDA)、k均值聚類、基於密度之雜訊應用空間聚類(DBSCAN)、隨機森林演算法或支援向量機(SVM)。
在方框2350處,可使用比較來判定生物樣本中臨床相關DNA之分數。若參數在統計學上與參考值相同,則可將病況之等級判定為與參考值相關聯之一或多名個體相同。
在一些實施例中,第一核酸酶可被鑑定為相對於多種組織類型中之至少一種其他組織類型,在目標組織類型中被差異調節。臨床相關之DNA分子可來自目標組織類型。例如,與白細胞之DNASE1表現水平相比,DNASE1在胎盤組織中之表現相對上調(圖22A)。在另一個例子中,與健康個體中之肝組織相比,DNASE1L3在HCC細胞中之表現相對下調。
第一核酸酶可被判定為優先將DNA切割成具有某一股特異性分類及/或序列末端模體之DNA分子。在一些情況下,藉由分析另一生物體(例如,小鼠)之生物樣本來判定第一核酸酶之切割偏好。然後,此等股特異性之分類及/或序列末端模體可用於判定臨床相關DNA之分數。
過程2300可包括額外的實施例,如下文所描述之任何單一實施例或實施例之任何組合及/或結合本文其他地方描述之一或多個其他過程。在第一實施例中,參考值係自臨床相關DNA分子之濃度分數已知的一或多個校準樣本中判定的。
儘管圖23顯示了過程2300之示例性方框,但在一些實施例中,過程2300可包括與圖23中所示之彼等方框相比額外的方框、更少的方框、不同的方框或不同排列的方框。另外或可替代地,過程2300之兩個或更多個方框可並行執行。 V. 治療 A. 其他篩選方式
基於任何分類,例如,關於病理學或臨床相關DNA之濃度分數,可將個體提及為額外的篩查方式,例如,使用胸部X射線、超音、電腦斷層掃描、磁共振成像或正電子發射斷層掃描。可為癌症執行該篩查。 B. 治療選擇
本揭露之實施例可準確地預測疾病復發(例如,腫瘤DNA分數在減少後的增加、在將癌症分類為不存在後存在的癌症分類),從而促進早期干預及選擇適當之治療以提高個體之疾病結果及總體存活率。例如,若個體之相應樣本可預測疾病復發,則可為其選擇強化化療。在另一個例子中,可對完成初始治療之個體之生物樣本進行定序,以鑑定可預測疾病復發之病毒DNA。在此類例子中,可為個體選擇替代治療方案(例如,更高劑量)及/或不同治療,因為個體之癌症可能對初始治療具有耐受性。
實施例亦可包括回應於判定病理學復發之分類來治療個體。例如,若預測對應於局部區域性失敗,則可選擇手術作為可能的治療。在另一個例子中,若預測對應於遠處轉移,則可另外選擇化療作為可能的治療。在一些實施例中,治療包括手術、放射治療、化療、免疫療法、靶向治療、激素治療、幹細胞治療或精準醫學。基於判定之復發分類,可制定治療計劃,以降低對個體之傷害風險且提高總生存率。實施例亦可包括根據治療計劃來治療個體。 C. 治療的類型
實施例亦可包括在判定個體之分類後治療患者中之病理。可根據判定之病理等級、臨床相關DNA之濃度分數或來源組織來提供治療。例如,可用特定的藥物或化學療法來靶向已識別之突變。來源組織可用於指導手術或任何其他形式之治療。且,病理學等級可用於判定任何類型之治療之侵襲性,此亦可基於病理學等級來判定。可藉由化學療法、藥物、飲食、治療及/或手術來治療病理學(例如,癌症)。在一些實施例中,參數之值(例如,量或尺寸)超過參考值越多,治療可能越具侵襲性。
治療可包括切除。對於膀胱癌,治療可包括經尿道膀胱腫瘤切除術(TURBT)。該程序用於診斷、分期及治療。在TURBT過程中,外科醫生藉由尿道將膀胱鏡插入膀胱中。然後使用帶小線圈之工具、雷射或高能電來切除腫瘤。對於患有非肌肉浸潤性膀胱癌(NMIBC)之患者,TURBT可用於治療或消除癌症。另一種治療可包括根治性切除術及淋巴結清掃術。根治性切除術係指切除整個膀胱以及可能的周圍組織及器官。治療亦可能包括尿路改道。尿路改道係當膀胱作為治療之一部分被切除時,醫生會為尿液創造一條新的通道,使其排出體外。
治療可包括化療,亦即使用藥物來摧毀癌細胞,通常藉由阻止癌細胞生長及分裂。藥物可能涉及例如但不限於,用於膀胱內化療之絲裂黴素-C (可作為仿製藥獲得)、吉西他濱(Gemzar)及塞替派(Tepadina)。全身化療可包括例如但不限於,順鉑吉西他濱、甲氨喋呤(Rheumatrex, Trexall)、長春鹼(Velban)、阿黴素及順鉑。
在一些實施例中,治療可包括免疫療法。免疫療法可包括阻斷一種名為PD-1之蛋白質之免疫檢查點抑制劑。抑制劑可包括但不限於阿特珠單抗(Tecentriq)、納武單抗(Opdivo)、阿維魯單抗(Bavencio)、度伐利尤單抗(Imfinzi)及帕博利珠單抗(Keytruda)。
治療實施例亦可包括靶向治療。靶向治療係一種靶向有助於癌症生長及存活之癌症特定基因及/或蛋白質之治療。例如,厄達替尼係一種經口給予之藥物,其被批准用於治療患有局部晚期或轉移性尿路上皮癌的人,其中FGFR3或FGFR2基因突變持續生長或癌症細胞擴散。
一些治療方法可包括放射治療。放射治療係使用高能x射線或其他粒子來摧毀癌細胞。除了每種單獨治療,亦可使用本文所描述之此等治療之組合。在一些實施例中,當參數之值超過臨限值(其本身超過參考值)時,可使用治療之組合。參考文獻中關於治療之資訊以引用之方式併入本文中。 VI. 系統
圖24示出了根據本揭露實施例之量測系統2400。如圖所示之系統包括分析設備2410內之生物個體2405,如生物體(例如,人)之生物樣本,其中發射器2408可向生物個體2405發送波。例如,生物個體2405可自發射器2408接收磁場及/或無線電波,以提供物理特性2415之信號。生物個體2405可包括用酶、標記物或者引子或其他試劑處理以促進偵測的物體。分析設備之實例可係定序設備。分析設備2410可包括複數個模組。
藉由偵測器2420偵測來自生物個體之物理特性特徵2415 (例如,光強度、電壓或電流)。偵測器2420可以間隔(例如,週期性間隔)進行量測以獲得組成資料信號之資料點。在一實施例中,模數轉換器多次將來自偵測器之類比信號轉換成數位形式。分析裝置2410及偵測器2420可形成測定系統,例如,根據本文所描述之實施例獲取資料之定序系統。資料信號2425自偵測器2420發送至邏輯系統2430。作為一個例子,資料信號2425可用於判定生物個體中核苷酸之特性。資料信號2425可包括同時進行的各種量測,例如,針對生物個體2405之不同區域之不同信號,且因此資料信號2425可對應於多種信號。資料信號2425可儲存在本端儲存記憶體2435、外部儲存記憶體2440或儲存裝置2445中。
邏輯系統2430可係或可包括電腦系統、ASIC、微處理器、圖形處理單元(GPU)等。其亦可包括顯示器(例如,監視器、LED顯示器等)及使用者輸入設備(例如,滑鼠、鍵盤、按鈕等)或與之耦接。邏輯系統2430及其他組件可係獨立的或網路連接之電腦系統的一部分,或者其可直接附接至包括偵測器2420及/或分析設備2410之設備(例如,成像系統)或整合至該設備中。邏輯系統2430亦可包括在處理器2450中執行的軟體。邏輯系統2430可包括電腦可讀介質,其儲存用於控制量測系統2400來執行本文所描述之任何方法之指令。例如,邏輯系統2430可向包括分析設備2410之系統提供命令,使得執行磁發射或其他物理操作。
量測系統2400亦可包括治療裝置2460,其可向個體提供治療。治療裝置2460可判定治療及/或用於執行治療。該治療的實例可包括手術、放射治療、化療、免疫療法、靶向治療、激素治療、幹細胞移植及放射性種子之植入。邏輯系統2430可連接至治療裝置2460,例如,以提供本文所描述之方法之結果。治療裝置可接收來自其他設備之輸入,如成像設備及使用者輸入(例如,以控制治療,如機器人系統上的控制)。
本文所提及之任何電腦系統均可利用任何合適數量之子系統。該子系統之實例在圖14中示出在電腦系統10中。在一些實施例中,電腦系統包括單個電腦裝置,其中子系統可係電腦裝置之組件。在其他實施例中,電腦系統可包括複數個電腦裝置,各電腦裝置均係具有內部組件之子系統。電腦系統可包括桌上型機及膝上型電腦、平板電腦、行動電話及其他行動設備。
圖14所示之子系統經由系統匯流排75相互連接。顯示了諸如印表機74、鍵盤78、儲存裝置79、耦接至顯示適配器82之監視器76 (例如,諸如LED的顯示屏)以及其他子系統之子系統。耦接至I/O控制器71之外圍設備及輸入/輸出(I/O)設備可藉由本領域已知之任何數量的方式連接至電腦系統,如輸入/輸出(I/O)埠77 (例如USB、Lightning)。例如,I/O埠77或外部介面81 (例如,乙太網路、Wi-Fi等)可用於將電腦系統10連接至廣域網路,如互聯網、滑鼠輸入設備或掃描儀。經由系統匯流排75之互連允許中央處理器73與各子系統通信,且控制來自系統儲存記憶體72或儲存裝置79 (例如,諸如硬碟驅動器或光碟之固定盤)的複數個指令的執行,以及子系統之間資訊的交換。系統儲存記憶體72及/或儲存裝置79可體現為電腦可讀介質。另一個子系統係資料收集裝置85,如照相機、麥克風、加速度計等。本文所提及之任何資料均可自一個組件輸出至另一個組件,且可輸出至使用者。
電腦系統可包括複數個相同的組件或子系統,例如,藉由外部介面81、藉由內部介面或經由可自一個組件連接至另一個組件及自另一組件移除的可移除儲存裝置連接在一起的組件或子系統。在一些實施例中,電腦系統、子系統或裝置可藉由網路進行通信。在該情況下,一台電腦可被視為使用者端,且另一台電腦則可被視為伺服器,其中每台電腦均可係同一電腦系統之一部分。使用者端及伺服器各自均可包括複數個系統、子系統或組件。
可以模組化或積體方式,利用一般可程式化處理器,使用硬體電路(例如,專用積體電路或現場可程式化閘陣列)及/或使用電腦軟體,以控制邏輯之形式來實施實施例之態樣。如本文所使用的,處理器可包括單核處理器、同一積體晶圓上之多核處理器或者單個電路板上或聯網之複數個處理單元,以及專用硬體。基於本文所提供之揭露及教導,本領域普通技術人員將知道且理解使用硬體以及硬體及軟體之組合來實施本揭露之實施例之其他方式及/或方法。
本申請案中描述之任何軟體組件或功能均可實現為由處理器使用任何適合之電腦語言執行的軟體程式碼,諸如例如Java、C、C++、C#、Objective-C、Swift,或者使用例如習知或面向個體之技術的腳本語言如Perl或Python。軟體程式碼可作為一系列指令或命令儲存在電腦可讀介質上,以用於儲存及/或傳輸。適合之非瞬時性電腦可讀介質可包括隨機存取儲存記憶體(RAM)、唯讀儲存記憶體(ROM)、諸如硬碟驅動器的磁介質或者諸如光碟(CD)或DVD (數位通用光碟)或藍光光碟、閃存等光學介質。電腦可讀介質可係該儲存或傳輸設備之任何組合。
亦可使用適於經由符合包括互聯網在內之各種協定的有線、光學及/或無線網路傳輸之載波信號來編碼及傳輸此類程序。由此,可使用用此類程序編碼之資料信號來創建電腦可讀介質。用程序程式碼編碼之電腦可讀介質可與相容設備一起打包,或者與其他設備分開提供(例如,經由互聯網下載)。任何此類電腦可讀介質均可位於單個電腦產品(例如硬碟驅動器、CD或整個電腦系統)上或其內,且可存在於系統或網路內之不同電腦產品上或其內。電腦系統可包括監視器、印表機或其他適合之顯示器,以用於向使用者提供本文所提及之任何結果。
本文所描述之任何方法均可完全或部分地用包括一或多個處理器之電腦系統來執行,該一或多個處理器可組態為執行步驟。因此,實施例可針對組態為執行本文所描述之任何方法步驟之電腦系統,可能具有執行相應步驟或相應步驟組之不同組件。儘管呈現為經編號之步驟,但本文之方法步驟可在相同時間或不同時間或以邏輯上可能的不同順序執行。另外,此等步驟的部分可與來自其他方法之其他步驟的部分一起使用。而且,步驟之全部或部分可係視情況選用的。另外,任何方法之任何步驟均可用用於執行此等步驟之系統的模組、單元、電路或其他方式來執行。
如本領域技術人員在閱讀本揭露後將顯而易見的,在不脫離本揭露的範圍或精神的情況下,本文描述及示出之單獨實施例中之各項均具有離散之組分及特徵,此等組分及特徵可容易地與其他幾項實施例中之任一項之特徵分離或組合。
以上對本揭露之示例性實施例之描述係出於說明及描述之目的而提出的,且進行闡述以便向本領域普通技術人員提供如何製作及使用本揭露實施例的完整揭露及描述。其並不旨在窮舉或將本揭露限制於所描述之精確形式,其亦不旨在表示實驗係全部的或僅為執行的實驗。儘管為了清楚理解之目的,已經藉由舉例說明及實例的方式對本揭露進行了一些詳細描述,但根據本揭露的教導,對本領域普通技術人員容易顯而易見的是,在不脫離所附申請專利範圍之精神或範圍之情況下,可對其進行某些改變及修改。
因此,以上僅說明了本發明之原理。應當理解,本領域技術人員將能夠設計出各種組態,此等組態雖然並未在本文中明確描述或顯示,但體現了本發明之原理且包括在本發明之精神及範圍內。此外,本文所列舉之所有實例及條件性語言主要旨在幫助讀者理解本揭露之原理,而不限於此等具體列舉之實例及條件。此外,本文中敍述本發明之原理、態樣及實施例以及其具體實例之所有陳述均旨在涵蓋其結構及功能等效物。另外,意圖係此類等價物包括當前已知的等價物及將來開發的等價物,亦即無論結構如何,開發的執行相同功能的任何元素。因此,本發明之範圍不旨在侷限於本文所示及描述之示例性實施例。相反,本發明之範圍及精神藉由所附申請專利範圍來體現。
敍述「一個(a)」、「一種(an)」或「該(the)」旨在意指「一個/種或多個/種」,除非明確指出相反。使用「或」旨在意指「包容性的或」,且不為「排他性的或」,除非明確指出相反。提及「第一」組分並不一定要求提供第二組分。此外,除非明確說明,否則提及「第一」或「第二」組分並不會被引用之組分限制在特定位置。術語「基於」旨在意指「至少部分基於」。
申請專利範圍可被起草為排除任何可能視情況選用之元素。由此,本聲明旨在作為使用與申請專利範圍元素之陳述或「負」限制之使用相關的諸如「單獨(solely)」、「僅(only)」等排除性術語的先行基礎。
在提供值之範圍的情況下,應當理解,除非上下文另有明確指示,否則亦具體揭露了該範圍之上限及下限之間的中間值,至下限單位之十分之一。在該範圍中之任何所描述值或中間值與該範圍中之任何其他所描述值或中間值之間的各更小的範圍均包含在本揭露之實施例內。此等較小範圍之上限及下限可獨立地包括在該範圍內或排除在該範圍外,且其中任一個、兩個均不或兩個極限包括在更小範圍內之各範圍亦包括在本揭露內,受該範圍內任何明確排除之極限的限制。在該範圍包括一個或兩個極限之情況下,排除彼等包括的極限中之任一個或兩個之範圍亦包括在本揭露中。
本文所提及之所有專利、專利申請案、出版物及描述均出於所有目的以全文引用之方式併入本文中,就像各項單獨之出版物或專利被明確且單獨地指示以引用之方式併入本文中,且藉由引用併入本文中以揭露及描述與引用出版物相關之方法及/或材料。沒有一項被承認係先前技術。
71:I/O控制器 72:系統儲存記憶體 73:中央處理器 74:印表機 75:系統匯流排 76:監視器 77:I/O埠 78:鍵盤 79:儲存裝置 81:外部介面 82:顯示適配器 85:資料收集裝置 104:階段 108:片段 112:階段 116:突出部分 120:矩形 124:矩形 128:階段 132:髮夾適配子 136:髮夾適配子 140:分子 144:分子 148:分子 152:分子 156:分子 160:階段 164:階段 168:階段 204:切割位點 208:切割位點 250:階段 254:階段 300:過程 302:方框 304:方框 306:方框 308:方框 400:過程 402:方框 404:方框 406:方框 408:方框 1304:列 1308:列 1312:列 1316:行 1320:行 1324:行 1500:過程 1502:方框 1504:方框 1506:方框 1508:方框 1600:過程 1602:方框 1604:方框 1606:方框 1608:方框 1610:方框 1612:方框 1700:過程 1702:方框 1704:方框 1706:方框 1708:方框 1710:方框 2100:過程 2110:方框 2120:方框 2300:過程 2310:方框 2320:方框 2330:方框 2340:方框 2350:方框 2400:量測系統 2405:生物個體 2408:發射器 2410:分析設備 2415:物理特性 2420:偵測器 2425:資料信號 2430:邏輯系統 2435:本端儲存記憶體 2440:外部儲存記憶體 2445:儲存裝置 2450:處理器 2460:治療裝置
圖1顯示了根據本發明實施例之單分子即時定序平台上之單分子末端形態的並行分析的示意性概覽。
圖2A及2B顯示了根據本發明實施例之下一代定序(NGS)平台(例如,Illumina 平台)上之單分子末端形態的並行分析的示意性概覽。
圖3係根據本發明實施例之分析生物樣本之示例性過程的流程圖。
圖4係根據本發明實施例之分析生物樣本之示例性過程的流程圖。
圖5A及5B顯示了根據本發明實施例之不同鋸齒末端的頻率。
圖6A顯示了根據本發明實施例之來自健康個體及HCC個體之血漿DNA樣本的總體長度分佈圖。
圖6B顯示了根據本發明實施例之不同組合鋸齒末端分類之長度小於150 bp的片段頻率圖。
圖6C顯示了根據本發明實施例之不同組合鋸齒末端分類之長度大於280 bp的片段頻率圖。
圖7A及7B係根據本發明實施例之涉及不同鋸齒末端之長度比率的圖。
圖8係根據本發明實施例之不同鋸齒末端類型之CCCA末端模體的圖。
圖9A及9B顯示了根據本發明實施例之可組合鋸齒末端、5'末端模體及3'末端模體以量測cfDNA分子之聯合末端形態的技術。
圖10A及10B示出了根據本發明實施例之用於命名聯合末端模體的技術。
圖11A係HCC及健康個體之間的總體5'末端模體頻率的相關性圖。
圖11B係根據本發明實施例之HCC及健康個體之間的聯合末端模體頻率的相關性圖。
圖11C係根據本發明實施例之HCC及健康個體之間的聯合末端模體頻率的相關性圖。
圖12A-12F係根據本發明實施例之不同核酸酶活性之不同鋸齒末端形態頻率的圖。
圖13係根據本發明實施例之WT、DNASE1L3-/-、DNASE1-/-及DFFB-/-小鼠中具有5'突出鋸齒末端、3'突出鋸齒末端及鈍末端之片段中5' A端、T端、C端及G端的中值頻率及相對變化的表。
圖14A-14D係根據本發明實施例之DFFB -/-(DFFB敲除[KO])小鼠及野生型(WT)小鼠之末端模體排序圖。
圖15係根據本發明實施例之分析生物樣本之示例性過程的流程圖。
圖16係根據本發明實施例之分析生物樣本之示例性過程的流程圖。
圖17係根據本發明實施例之分析生物樣本之示例性過程的流程圖。
圖18A-18C顯示了根據本發明實施例之胎兒特異性的及共有的cfDNA片段之不同的突出鋸齒末端的頻率。
圖18D係根據本發明實施例之自具有不同類型之突出鋸齒末端之片段推導的胎兒DNA濃度分數的圖。
圖19係根據本發明實施例之胎兒DNA濃度分數相對於不同鋸齒末端形態的圖。
圖20A及20B係根據本發明實施例之自具有某些鋸齒末端形態及序列末端模體之片段推導的胎兒DNA濃度分數的圖。
圖21係根據本發明實施例之用於富集臨床相關DNA之生物樣本之示例性過程的流程圖。
圖22A係根據本發明實施例之白細胞及胎盤中DNASE1之mRNA表現水平的圖。
圖22B係根據本發明實施例之白細胞及胎盤中DFFB之mRNA表現水平的圖。
圖22C係根據本發明實施例之攜帶5'突出鋸齒末端之胎兒DNA濃度分數及cfDNA片段頻率之間的相關性的圖。
圖22D係根據本發明實施例之攜帶鈍末端之胎兒DNA濃度分數及cfDNA片段頻率之間的相關性的圖。
圖23係根據本發明實施例之用於判定生物樣本中臨床相關DNA分數之示例性過程的流程圖。
圖24示出了根據本發明實施例之量測系統。
圖25示出了根據本發明實施例之電腦系統。
104:階段
108:片段
112:階段
116:突出部分
120:矩形
124:矩形
128:階段
132:髮夾適配子
136:髮夾適配子
140:分子
144:分子
148:分子
152:分子
156:分子
160:階段
164:階段
168:階段

Claims (75)

  1. 一種分析包含複數個游離之核酸分子之生物樣本的方法,該方法包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第一末端將第一髮夾適配子連接至該核酸分子之第一股及該核酸分子之第二股,其中該第一髮夾適配子包含第一序列標識符,該第一序列標識符在該第一髮夾適配子之第一末端識別在該第一髮夾適配子之第二末端無互補部分的第一長度的零個或多個核苷酸,以及 在該核酸分子之第二末端將第二髮夾適配子連接至該第一股及該第二股,其中該第二髮夾適配子包含第二序列標識符,該第二序列標識符在該第二髮夾適配子之第一末端識別在該第一髮夾適配子之第二末端無互補部分的第二長度的零個或多個核苷酸,從而生成複數個經連接之核酸分子; 在該複數個經連接之核酸分子之第一子集上進行滾環擴增,以形成複數個多聯體;以及 對該複數個多聯體中之各多聯體定序,以識別相應的第一序列標識符及相應的第二序列標識符。
  2. 如請求項1之方法,其中定序與滾環擴增同時進行。
  3. 如請求項1之方法,其進一步包括: 使用該第一序列標識符判定存在於該複數個核酸分子之第一子集中之核酸分子之第一末端突出部分的長度,以及 使用該第二序列標識符判定存在於該複數個核酸分子之第一子集中之核酸分子之第二末端突出部分。
  4. 如請求項1之方法,其進一步包括: 向該複數個經連接之核酸分子添加核酸外切酶,以移除該複數個經連接之核酸分子之第二子集,其中: 該複數個經連接之核酸分子之第一子集不包括該第二子集中之任何核酸分子, 對於該第二子集中之各核酸分子: 相應的核酸分子不與相應的第一髮夾適配子或相應的第二髮夾適配子完全雜交,或者 相應的第一髮夾適配子或相應的第二髮夾適配子不與相應的核酸分子完全雜交。
  5. 如請求項1之方法,其進一步包括: 使用該第一序列標識符判定存在於該複數個經連接之核酸分子之第一子集中的核酸分子之第一末端的突出部分的第一序列末端模體;以及 使用該第二序列標識符判定存在於該複數個經連接之核酸分子之第一子集中的核酸分子之第二末端的突出部分的第二序列末端模體。
  6. 如請求項1之方法,其進一步包括: 對於該第一子集在該第一末端具有突出部分的各核酸分子,使用相應的第一序列標識符判定5'股或3'股是否突出於另一股之外,以及 對於該第一子集在該第二末端具有突出部分的各核酸分子,使用相應的第二序列標識符判定5'股或3'股是否突出於另一股之外。
  7. 如請求項1至6中任一項之方法,其中: 該生物樣本係獲自懷有胎兒之女性個體, 該方法進一步包括: 選擇5'股或3'股突出於另一末端之外的複數個核酸分子之子集,以及 分析該核酸分子之子集以理解該胎兒之特徵。
  8. 如請求項1之方法,其中: 複數個第一髮夾適配子中之各第一髮夾適配子包含第一切割位點,且 複數個第二髮夾適配子中之各第二髮夾適配子包含第二切割位點, 該方法進一步包括: 在相應的第一切割位點及相應的第二切割位點處切割該複數個多聯體中之各多聯體。
  9. 如請求項1之方法,其中該第一子集之第二部分中之各核酸分子在相應的第一末端具有與相應的第二股平齊的相應的第一股。
  10. 如請求項1之方法,其中: 該第一子集之第二部分中之各核酸分子在相應的第一末端具有突出於相應的第一股之外的相應的第二股, 該相應的第一股係5'股,且 該相應的第二股係3'股。
  11. 一種分析包含複數個游離之核酸分子之生物樣本的方法,該方法包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第一末端將第一髮夾適配子連接至該核酸分子之第一股及該核酸分子之第二股,其中該第一髮夾適配子包含第一序列標識符,該第一序列標識符在該第一髮夾適配子之第一末端識別在該第一髮夾適配子之第二末端無互補部分的第一長度的零個或多個核苷酸,以及 在該核酸分子之第二末端將第二髮夾適配子連接至該第一股及該第二股,其中該第二髮夾適配子包含第二序列標識符,該第二序列標識符在該第二髮夾適配子之第一末端識別在該第一髮夾適配子之第二末端無互補部分的第一長度的零個或多個核苷酸,從而生成複數個經連接之核酸分子; 向該複數個經連接之核酸分子添加核酸外切酶,以移除該複數個經連接之核酸分子之第一子集,其中: 對於該第一子集中之各核酸分子: 相應的核酸分子不與相應的第一髮夾適配子或相應的第二髮夾適配子完全雜交,或者 相應的第一髮夾適配子或相應的第二髮夾適配子不與相應的核酸分子完全雜交, 對該複數個經連接之核酸分子之第二子集中之各經連接之核酸分子進行定序,以識別相應的第一序列標識符及相應的第二序列標識符,其中在移除該第一子集後,該第二子集保留在該生物樣本中。
  12. 如請求項11之方法,其進一步包括: 使用該第一序列標識符判定存在於該複數個核酸分子之第二子集中之核酸分子之第一末端的突出部分的第一長度,以及 使用該第二序列標識符判定存在於該複數個核酸分子之第二子集中之核酸分子之第二末端的第二突出部分。
  13. 如請求項11之方法,其進一步包括: 使用該第一序列標識符判定存在於該複數個核酸分子之第二子集中之核酸分子之第一末端的突出部分的第一序列末端模體;以及 使用該第二序列標識符判定存在於該複數個核酸分子之第二子集中之核酸分子之第二末端的突出部分的第二序列末端模體。
  14. 如請求項11之方法,其進一步包括: 對於該第二子集中之在該第一末端具有突出部分的各核酸分子,使用相應的第一序列標識符判定5'股或3'股是否突出於另一股之外,以及 對於該第二子集中之在該第二末端具有突出部分的各核酸分子,使用相應的第二序列標識符判定5'股或3'股是否突出於另一股之外。
  15. 如請求項11至14中任一項之方法,其中: 該生物樣本係獲自懷有胎兒之女性個體, 該方法進一步包括: 選擇5'股或3'股突出於另一末端之外的複數個核酸分子之子集,以及 分析該核酸分子之子集以理解該胎兒之特徵。
  16. 一種分析包含複數個游離之核酸分子之生物樣本的方法,該複數個核酸分子中之各核酸分子係具有第一股及第二股之雙股,該生物樣本係獲自個體,該複數個核酸分子中之至少一些核酸分子在一股上具有在另一股上無互補部分的核苷酸,該方法包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第一末端之第一股特異性的分類,亦即指示該第一股或該第二股是否突出於另一股之外的股特異性的分類; 使用該複數個核酸分子之第一股特異性的分類判定鋸齒末端值; 將該鋸齒末端值與參考值進行比較;以及 使用該比較判定該個體病況之等級。
  17. 如請求項16之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第二末端之第二股特異性的分類, 其中: 使用該第二股特異性的分類判定該鋸齒末端值。
  18. 如請求項16之方法,該股特異性之分類亦指突出部分之長度。
  19. 如請求項17之方法,其中: 該鋸齒末端值係向量中之元素, 該向量包括複數個元素,且 該複數個元素包括以下分類中之核酸分子的量: 該第一末端為鈍末端及該第二末端為鈍末端, 該第一末端為5'突出部分及該第二末端為鈍末端, 該第一末端為3'突出部分及該第二末端為鈍末端, 該第一末端為5'突出部分及該第二末端為3'突出部分, 該第一末端為5'突出部分及該第二末端為5'突出部分,以及 該第一末端為3'突出部分及該第二末端為3'突出部分; 該方法進一步包括: 將該向量與參考向量進行比較; 其中使用該向量與該參考向量的比較以判定該個體病況之等級。
  20. 如請求項19之方法,其中該複數個元素包括長度在一或多個長度範圍內之核酸分子的分類。
  21. 如請求項16至20中任一項之方法,其中該病況係核酸酶活性缺陷。
  22. 一種分析包含複數個核酸分子之生物樣本的方法,該複數個核酸分子中之各核酸分子係具有第一股及第二股之雙股,該複數個核酸分子中之至少一些核酸分子在一股上具有在另一股上無互補部分的核苷酸,該生物樣本係獲自個體,該方法包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第一末端判定該第一股之第一序列末端模體,以及 在該核酸分子之第一末端判定該第二股之第二序列末端模體; 判定在該第一末端具有該第一序列末端模體及該第二序列末端模體之第一組合的核酸分子的第一量; 使用該第一量生成末端模體參數的值; 將該末端模體參數的值與參考值進行比較;以及 使用該比較判定該個體病況之等級。
  23. 如請求項22之方法,其中該第一股在該第一末端具有3'末端,且該第一股突出於該第二股之外。
  24. 如請求項22之方法,其中該第一末端包括鈍末端。
  25. 如請求項22之方法,其進一步包括: 判定在該第一末端具有第三序列末端模體及第四序列末端模體之第二組合的核酸分子的第二量, 其中: 使用該第二量生成該末端模體參數的值。
  26. 如請求項22之方法,其中: 該複數個核酸分子係第一複數個核酸分子, 該生物樣本包含第二複數個核酸分子,且 該第一複數個核酸分子包括該第二複數個核酸分子之子集, 該方法進一步包括: 對於第二複數個核酸分子中之各核酸分子: 在該核酸分子之第二末端判定該第一股上之第三序列末端模體,以及 在該核酸分子之第二末端判定該第二股上之第四序列末端模體, 判定在該第二末端具有該第三序列末端模體及該第四序列末端模體之第二組合的核酸分子的第二量,其中: 使用該第二量生成該末端模體參數的值。
  27. 如請求項22至26中任一項之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第一末端之第一股特異性的分類,亦即指該第一股或該第二股是否突出於另一股之外的股特異性的分類, 其中判定該第一量包括判定具有該第一組合及該第一股特異性之分類之核酸分子的第一量。
  28. 如請求項27之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第二末端之第二股特異性的分類, 其中判定該第一量包括判定具有該第一組合、該第一股特異性之分類及該第二股特異性之分類之核酸分子的第一量。
  29. 如請求項22之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第二末端判定該第一股之第三序列末端模體,以及 在該核酸分子之第二末端判定該第二股上之第四序列末端模體; 其中: 該第一組合係該第一末端之第一序列末端模體、該第一末端之第二序列末端模體、該第二末端之第三序列末端模體及該第二末端之第四序列末端模體的組合。
  30. 如請求項29之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第一末端之第一股特異性的分類,該股特異性的分類指該第一股或該第二股是否突出於另一股之外, 量測該核酸分子之第二末端之第二股特異性的分類, 其中判定該第一量包括判定具有該第一組合、該第一股特異性之分類及該第二股特異性之分類之核酸分子的第一量。
  31. 如請求項22至28中任一項之方法,其中該病況係癌症。
  32. 如請求項22至28中任一項之方法,其中該病況係核酸酶活性缺陷。
  33. 一種分析包含複數個游離之核酸分子之生物樣本的方法,該生物樣本係獲自個體,該複數個核酸分子中之各核酸分子係具有第一股及第二股之雙股,該複數個核酸分子中之至少一些核酸分子在一股上具有在另一股上無互補部分的核苷酸,該方法包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第一末端判定股之第一序列末端模體,其中該第一末端係該股的3'末端; 在該第一末端判定具有該第一序列末端模體之核酸分子的第一量; 使用該第一量生成該末端模體參數的值; 將該末端模體參數的值與參考值進行比較;以及 使用該比較判定該個體病況之等級。
  34. 如請求項33之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第二末端判定該股之第二序列末端模體, 其中: 該第一量係在該第一末端具有該第一序列末端模體及在該第二末端具有該第二序列末端模體之核酸分子的量。
  35. 如請求項33之方法,其中: 該股係第一股, 該末端模體參數係第一末端模體參數,且 該參考值係第一參考值, 該方法進一步包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第二末端判定第二股之第二序列末端模體, 判定在該第二末端具有該第二序列末端模體之核酸分子的第二量, 使用該第二量生成第二末端模體參數的值, 將該第二末端模體參數的值與第二參考值進行比較,以及 使用該比較判定該病況之等級。
  36. 如請求項33至35中任一項之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第一末端之第一股特異性的分類,該股特異性的分類指該第一股或該第二股是否突出於另一股之外; 其中判定該第一量包括判定具有該第一組合及該第一股特異性之分類之核酸分子的第一量。
  37. 如請求項36之方法,其中該第一股特異性之分類係該3'股突出於該5'股之外。
  38. 如請求項36之方法,其進一步包括: 對於多數複數個核酸分子中之各核酸分子: 量測該核酸分子之第二末端之第二股特異性的分類; 其中判定該第一量包括判定具有該第一組合、該第一股特異性之分類及該第二股特異性之分類之核酸分子的第一量。
  39. 一種在生物樣本中富集臨床相關之DNA的方法,該生物樣本包含游離之複數個核酸分子,該複數個核酸分子包括該臨床相關之DNA及其他DNA,該複數個核酸分子中之各核酸分子係具有第一股及第二股之雙股,該方法包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第一末端之第一股特異性的分類,亦即指該第一股或該第二股是否突出於另一股之外的股特異性的分類;以及 選擇具有該第一股特異性之分類之核酸分子的子集,以形成富集的樣本。
  40. 如請求項39之方法,其中該核酸分子之子集具有該第一股的突出於該第二股之外的第一股特異性之分類。
  41. 如請求項40之方法,其中該第一股係3'股。
  42. 如請求項39之方法,其中該第一股特異性之分類包括該第一股突出於該第二股之外及該第二股突出於該第一股之外。
  43. 如請求項39之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第二末端之第二股特異性的分類, 其中該核酸分子之子集具有該第二股特異性的分類。
  44. 如請求項43之方法,其中: 該核酸分子之子集之第一股特異性的分類指該核酸分子之第一股突出於該第二股之外,且 該核酸分子之子集之第二股特異性的分類指該核酸分子之第二股突出於該第一股之外。
  45. 如請求項39之方法,其中該臨床相關之DNA係腫瘤DNA。
  46. 如請求項39之方法,其中該生物樣本係獲自懷有胎兒之女性個體,且該臨床相關之DNA係胎兒DNA。
  47. 如請求項45或46之方法,其進一步包括分析該核酸分子之子集以判定病況等級之分類。
  48. 如請求項39之方法,其進一步包括分析該核酸分子之子集以判定染色體畸變或胎兒單倍型。
  49. 如請求項39至48中任一項之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第一末端判定第一序列末端模體, 其中選擇對應於該核酸分子之子集包括選擇對應於具有該第一序列末端模體之核酸分子。
  50. 如請求項49之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 在該核酸分子之第二末端判定第二序列末端模體, 其中選擇對應於該核酸分子之子集包括選擇對應於具有該第二序列末端模體之核酸分子。
  51. 如請求項49或50之方法,其進一步包括: 判定該讀數的第一量; 使用該讀數的第一量判定第一參數;以及 使用該第一參數判定該生物樣本之特徵。
  52. 如請求項51之方法,其中該生物樣本之特徵係該生物樣本中之臨床相關DNA分子的濃度分數。
  53. 如請求項51之方法,其中該第一參數使用序列讀數之該第一量及另一量進行判定。
  54. 如請求項51之方法,其中該生物樣本之特徵係該生物樣本之異常程度。
  55. 一種判定包含複數個游離之核酸分子之生物樣本中之臨床相關DNA分數的方法,該複數個核酸分子中之各核酸分子係具有第一股及第二股之雙股,該生物樣本係獲自個體,該複數個核酸分子中之至少一些核酸分子在一股上具有在另一股上無互補部分的核苷酸,該方法包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第一末端之第一股特異性的分類,亦即指該第一股或該第二股是否突出於另一股之外之股特異性的分類,其中該第一股係3'股,或者 判定第一序列末端模體存在於該核酸分子之第一末端且第二序列末端模體存在於該核酸分子之第二末端; 判定具有該第一股突出於該第二股之外的第一股特異性分類的核酸分子的第一量,或者判定該第一序列末端模體的第二量及該第二序列末端模體的第三量; 使用該第一量或者該第二量及該第三量兩者來判定參數; 將該參數與參考值進行比較;以 使用該比較判定該生物樣本中臨床相關之DNA的分數。
  56. 如請求項55之方法,其中該參考值自該臨床相關之DNA分子的濃度分數已知的一或多個校準樣本進行判定。
  57. 如請求項55之方法,其進一步包括判定該第一量,其中使用該第一量判定該參數。
  58. 如請求項55之方法,其進一步包括: 判定該第一量,以及 判定具有該第二股突出於該第一股之外的第一股特異性之分類之核酸分子的第四量, 其中使用該第一量及該第四量判定該參數。
  59. 如請求項58之方法,其進一步包括: 判定具有該第一股與該第二股平齊的第一股特異性之分類之核酸分子的第五量, 其中使用該第一量、該第四量及該第五量判定該參數。
  60. 如請求項55之方法,其進一步包括判定該第二量及該第三量,其中使用該第二量及該第三量判定該參數。
  61. 如請求項60之方法,其進一步包括判定該第一量,其中使用該第一量、該第二量及該第三量判定該參數。
  62. 如請求項55之方法,其進一步包括: 對於該複數個核酸分子中之各核酸分子: 量測該核酸分子之第二末端之第二股特異性的分類;以及 判定具有該第二股特異性之分類之核酸分子的第四量, 其中使用該第一量及該第四量判定該參數。
  63. 如請求項55之方法,其中機器學習模型被用於執行該參數及該參考值的比較。
  64. 如請求項63之方法,其中該機器學習模型包括線性回歸、邏輯回歸、深度循環神經網路、貝葉斯分類器、隱馬爾可夫模型(HMM)、線性判別分析(LDA)、k均值聚類、基於密度之雜訊應用空間聚類(DBSCAN)、隨機森林演算法或支援向量機(SVM)。
  65. 如請求項55之方法,其中該臨床相關之DNA係胎兒DNA。
  66. 如請求項55之方法,其中該臨床相關之DNA係腫瘤DNA。
  67. 如請求項55之方法,其中該臨床相關之DNA係來自組織類型的DNA。
  68. 如請求項16至65中任一項之方法,其中突出部分之長度係藉由請求項1至10中任一項之方法進行判定。
  69. 如前述請求項中任一項之方法,其中該複數個核酸分子中之各核酸分子具有大於臨限值的長度。
  70. 如前述請求項中任一項之方法,其中該複數個核酸分子中之各核酸分子具有小於臨限值的長度。
  71. 如請求項69或70之方法,其進一步包括藉由將對應於相應的核酸分子末端之子序列與參考基因體進行比對來量測各核酸分子之長度
  72. 如前述請求項中任一項之方法,其中該病況係癌症、肝癌、自體免疫性疾病或妊娠相關之病症。
  73. 如前述請求項中任一項之方法,其中該參考值自一或多名患有某一等級之該病況的個體或者一或多名健康個體進行判定。
  74. 一種電腦產品,其包括非瞬時性電腦可讀介質,該非瞬時性電腦可讀介質儲存在執行時控制電腦系統執行任何前述請求項之方法的複數個指令。
  75. 一種系統,其包括: 如請求項74之電腦產品;以及 用於執行儲存在該電腦可讀介質上的指令的一或多個處理器。
TW113106609A 2023-02-23 2024-02-23 單分子股特異性之末端形態 TW202438678A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202363447847P 2023-02-23 2023-02-23
US63/447,847 2023-02-23

Publications (1)

Publication Number Publication Date
TW202438678A true TW202438678A (zh) 2024-10-01

Family

ID=92461260

Family Applications (1)

Application Number Title Priority Date Filing Date
TW113106609A TW202438678A (zh) 2023-02-23 2024-02-23 單分子股特異性之末端形態

Country Status (7)

Country Link
US (1) US20240287593A1 (zh)
KR (1) KR20250163332A (zh)
CN (1) CN120641574A (zh)
AU (1) AU2024226173A1 (zh)
IL (1) IL322624A (zh)
TW (1) TW202438678A (zh)
WO (1) WO2024175089A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015157747A1 (en) * 2014-04-11 2015-10-15 Redvault Biosciences Lp Systems and methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications
EP3485037B1 (en) * 2016-07-18 2022-02-09 F. Hoffmann-La Roche AG Asymmetric templates and asymmetric method of nucleic acid sequencing
JP6876785B2 (ja) * 2016-07-18 2021-05-26 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 単分子配列決定のための一本鎖環状dnaライブラリーを生成するための方法
WO2019101596A1 (en) * 2017-11-21 2019-05-31 Expedeon Ltd Methods and kits for amplification of double stranded dna
SG11202100564PA (en) * 2018-07-23 2021-02-25 Univ Hong Kong Chinese Cell-free dna damage analysis and its clinical applications
US20220010353A1 (en) * 2020-07-13 2022-01-13 The Chinese University Of Hong Kong Nuclease-associated end signature analysis for cell-free nucleic acids
EP4367264A1 (en) * 2021-07-08 2024-05-15 Pacific Biosciences Of California, Inc. Paired-end sequencing methods and compositions

Also Published As

Publication number Publication date
US20240287593A1 (en) 2024-08-29
WO2024175089A1 (en) 2024-08-29
KR20250163332A (ko) 2025-11-20
AU2024226173A1 (en) 2025-09-11
CN120641574A (zh) 2025-09-12
IL322624A (en) 2025-10-01

Similar Documents

Publication Publication Date Title
CN107077537B (zh) 用短读测序数据检测重复扩增
CA2868836C (en) Rapid aneuploidy detection
CN104254618B (zh) 母体血浆中胎儿dna分数的基于大小的分析
US12098429B2 (en) Determining linear and circular forms of circulating nucleic acids
CN114999567A (zh) 游离dna的片段化模式的分析
US20210065842A1 (en) Systems and methods for determining tumor fraction
US20210238668A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
CN116157538A (zh) 游离核酸的核酸酶相关末端特征分析
CN119546781A (zh) 无细胞dna的表观遗传学分析
WO2022121894A1 (en) Methods using characteristics of urinary and other dna
US20240287593A1 (en) Single-molecule strand-specific end modalities
US20250079005A1 (en) Eccdna remnants as a cancer biomarker
US20250171858A1 (en) Enrichment of clinically-relevant nucleic acids
WO2024114678A1 (en) Fragmentomics in urine and plasma
US20240296920A1 (en) Redacting cell-free dna from test samples for classification by a mixture model
CN116685690A (zh) 使用尿液和其他dna的特征的方法
TW202540440A (zh) 對臨床相關核酸的富集
CA3270171A1 (en) Fragmentomics in urine and plasma
HK40079331A (zh) 游离dna的片段化模式的分析
HK40080623A (zh) 无细胞样品中的双末端dna片段类型及其用途