[go: up one dir, main page]

CN116403647B - 一种检测慢病毒整合位点的生物信息检测方法及其应用 - Google Patents

一种检测慢病毒整合位点的生物信息检测方法及其应用 Download PDF

Info

Publication number
CN116403647B
CN116403647B CN202310671349.7A CN202310671349A CN116403647B CN 116403647 B CN116403647 B CN 116403647B CN 202310671349 A CN202310671349 A CN 202310671349A CN 116403647 B CN116403647 B CN 116403647B
Authority
CN
China
Prior art keywords
reads
filtering
integration
sequence
biological information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310671349.7A
Other languages
English (en)
Other versions
CN116403647A (zh
Inventor
黄启宽
朱国振
彭祥翔
董风晴
陈苗苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinghan Biotechnology Co ltd
Original Assignee
Shanghai Jinghan Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinghan Biotechnology Co ltd filed Critical Shanghai Jinghan Biotechnology Co ltd
Priority to CN202310671349.7A priority Critical patent/CN116403647B/zh
Publication of CN116403647A publication Critical patent/CN116403647A/zh
Application granted granted Critical
Publication of CN116403647B publication Critical patent/CN116403647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioethics (AREA)
  • Genetics & Genomics (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于生物信息检测领域,更具体地,涉及一种检测慢病毒整合位点的生物信息检测方法及其应用。本发明提供一种检测慢病毒整合位点的生物信息检测方法。其基于LAM‑PCR和NGS测序结果,建立数据过滤与预处理过滤策略,建立慢病毒整合位点检测与过滤策略,降低假阳率,提高整合位点准确性。还可对整合基因的拷贝数进行准确定量,同时独特分子标签采用三个随机碱基设计,可同时对测序错误进行校正。通过对整合位点的所在位置、基因功能区、TSS、CpG、原癌/抑癌基因相关信息注释和统计,多维度评估慢病毒的安全性和多样性,尽可能全面反映病毒插入对于患者机体的致病风险。

Description

一种检测慢病毒整合位点的生物信息检测方法及其应用
技术领域
本发明属于生物信息检测领域,更具体地,涉及一种检测慢病毒整合位点的生物信息检测方法及其应用。
背景技术
对慢病毒随机插入的评估方法随着基因/细胞治疗的应用发展而发展。以往的研究中,人们最早利用Southern杂交和前病毒PCR的方法进行病毒插入位点的鉴定,该方法的问题是灵敏度和特异性不够。随之,线性扩增介导的PCR(Linear Amplification-MediatedPCR, LAM-PCR)的开发,并与二代测序技术结合,显著提高病毒插入位点的检出灵敏度。由于二代测序技术系统性误差,需要对测序数据进行预处理,和数据过滤,提高准确度。二代测序技术通量高,数据量大,数据处理流程相对复杂,难以使用简单数据处理获得插入位点信息。
因此,本领域需求一种能够降低数据分析复杂度,提高检测的灵敏度的方法,对慢病毒载体的安全性进行评估。
发明内容
有鉴于此,第一方面,本发明的目的之一是提供一种检测慢病毒整合位点的生物信息检测方法,包括:
S1、慢病毒整合位点数据过滤和预处理,其中,包括
1)过滤测序文件;
2)筛选R1 序列的前20-42bp LTR序列与参考LTR序列之间mismatch<= 1bp的reads;
3) 筛选R2 序列的前35-47bp Linker序列与参考Linker序列之间mismatch<=1bp的reads;以及
S2、慢病毒整合位点信息检测和评估,其中,包括
4)与参考基因组进行比对,得到在参考基因组上的比对结果;
5)过滤没有比对到参考基因组的reads;过滤mapq<30的reads; 过滤比对到基因组上长度小于55bp的reads; 统计R1比对到基因组上位置;合并300bp范围整合位点;统计各个位点对应的support reads 数量和UMI数量。过滤整合位点supportreads<10的位点;
6)注释整合点所在基因的功能区域;距转录起始位点的距离;距CpG岛的距离;所在基因是否为癌基因或抑癌基因;
7)进行评估。
进一步地,在一些实施方案中,步骤1)具体包括对测序下机得到的fastq文件去除接头,删除read末端测序错误的N碱基;删除过滤后长度低于47bp的reads。
进一步地,S1还包括获取R2中包含的UMI序列,并过滤UMI中包含C碱基的reads,以及裁剪由于文库过短导致R1/R2 测通,导致R1 3’端包含R2的Linker序列,R2 3’端导致包含LTR序列。
进一步地,步骤4)具体包括使用Bowtie2设置--very-sensitive --no-mix参数,得到paired-end在参考基因组上的比对结果。
进一步地,所述步骤7)具体包括校正整合位点在各个染色体上的频率,并计算基尼系数和香农指数,评估整合位点的多样性和安全性。
本发明的方法基于LAM-PCR和NGS测序结果,建立数据过滤与预处理过滤策略,建立慢病毒整合位点检测与过滤策略,降低假阳率,提高整合位点准确性。还可对整合基因的拷贝数进行准确定量,同时独特分子标签采用三个随机碱基设计,可同时对测序错误进行校正。通过对整合位点的所在位置、基因功能区、TSS、CpG、原癌/抑癌基因相关信息注释和统计,多维度评估慢病毒的安全性和多样性,尽可能全面反映病毒插入对于患者机体的致病风险。
第二方面,一种设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述任一项所述的检测慢病毒整合位点的生物信息检测方法。
在一些实施方案中,所述设备还包括至少一个输入设备和至少一个输出设备;在所述设备中,所述处理器、存储器、输入设备、输出设备之间通过总线连接。
本发明的又一方面,提供了一种存储介质,所述存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现上述任一项所述的检测慢病毒整合位点的生物信息检测方法。
在一些实施方案中,存储介质为计算机可读存储介质。
本发明的又一方面,提供了一种装置,包括
数据过滤和预处理模块,包括
1)过滤测序文件;
2)筛选R1 序列的前20-42bp LTR序列与参考LTR序列之间mismatch<= 1bp的reads;
3) 筛选R2 序列的前35-47bp Linker序列与参考Linker序列之间mismatch<=1bp的reads;以及
慢病毒整合位点信息检测和评估模块,包括
4)与参考基因组进行比对,得到在参考基因组上的比对结果;
5)过滤没有比对到参考基因组的reads;过滤mapq<30的reads; 过滤比对到基因组上长度小于55bp的reads; 统计R1比对到基因组上位置;合并300bp范围整合位点;统计各个位点对应的support reads 数量和UMI数量。过滤整合位点supportreads<10的位点;
6)注释整合点所在基因的功能区域;距转录起始位点的距离;距CpG岛的距离;所在基因是否为癌基因或抑癌基因;
7)进行评估。
附图说明
图1为慢病毒整合位点检测文库结构示意图;
图2为碱基不匹配1bp情况示意图;
图3为IGV整合位点示意图。
具体实施方式
下文将结合具体实施方式和实施例,具体阐述本发明,本发明的优点和各种效果将由此更加清楚地呈现。本领域技术人员应理解,这些具体实施方式和实施例是用于说明本发明,而非限制本发明。
实施例1、本发明方法对样品细胞系(110621P3MX-6)的检测
采用已知整合位点信息的细胞系(110621P3MX-6)和人基因组作为测试样品,文库结构如图1所示。经建库并测序后,得到样本原始fastq文件R1.raw.fastq和R2.raw.fastq。基于原始fastq文件进行整合位点生信检测分析:
1. 数据过滤机预处理
1.1去接头、N末端和短序列
使用trim_galoe软件进行对fastq中reads中包含的接头信息进行去除;删除read末端测序错误的N碱基。根据文库设计R1 5’端前42bp为人工设计的片段,R2 5’端前47bp为人工设计的片段,经过前面两步过滤后,保留的有效长度最少为47bp,否则结构不完整需排除,所以需要过滤长度小于47bp的reads。最终得到R1.trim.fastq和R2.trim.fastq。
1.2筛选LTR
R1中前42bp为人工序列,其中前19bp为引物序列,20-42bp为已知的LTR序列“GTCAGTGTGGAAAATCTCTAGCA”。提取R1.trim.fastq中20-42bp序列,并与已知的LTR序列进行比较,如图2所示,同时过滤因为碱基替换、插入或缺失导致R1中LTR与参考LTR不匹配长度超过1bp的reads,得到符合的reads名称并记录于LTR.Found.txt,同时筛选R1.trim.fastq和R2.trim.fastq中属于LTR.Found.txt的reads,最终得到R1.LTR.found.fastq和R1.LTR.found.fastq。
1.3筛选Linker
R2中前47bp为人工序列,其中前19bp为引物序列,20-34bp为UMI序列,35-47为已知的Linker序列“GCTCTTCCGATCT”。 提取R2.trim.fastq中35-47bp序列,并与已知的Linker序列进行比较,如图1所示,同时过滤因为碱基替换、插入或缺失导致R2中Linker与参考Linker不匹配长度超过1bp的reads,得到符合的reads名称并记录于linker.Found.txt,同时筛选R1.LTR.found.fastq和R2.LTR.found.fastq中属于linker.Found.txt的reads,最终得到R1.LTR.linker.found.fastq和R2.LTR.linker.found.fastq。
1.4提取UMI序列
R2序列中加随机序列UMI,用以消除PCR重复。从R2.LTR.linker.found.fastq文件中提取每条reads的20-34bp位置的UMI序列,得到umi.txt。然后过滤UMI序列中
1.5提取宿主序列
经过前4个步骤,可以得到具有完整结构的文库。将R1中前42bp序列剔除,将R2中前47bp序列剔除,最终得到宿主细胞的序列R1.host.fastq和R1.host.fastq。
1.6消除soft-clip
当某些文库序列过短时,会导致序列被测通,从而在R1的3’端包含Linker的反向互补序列;R2的3’端包含LTR的互补序列,在后续比对步骤会引入soft-clip,影响慢病毒整合位点的位置的判定。通过将Linker后10bp的反向互补序列作为接头,去除R1序列3’端的soft-clip;将LTR后10bp的反向互补序列作为接头,去除R2 序列3’端的soft-clip。最终得到R1.host.trim.fastq和R1.host.trim.fastq。
慢病毒整合位点定量检测及评估
序列比对
使用bowtie2将R1.host.trim.fastq和R1.host.trim.fastq比对到参考基因组,设置--very-sensitive --no-mix参数,得到paired-end唯一比对到基因组上结果bam文件。
整合位点位置检测
解析bam文件中每条reads的比对信息,过滤没有比对到参考基因组的reads;过滤mapq<30的reads; 过滤比对到外源序列的reads; 过滤cigar值中比对到参考基因组上序列长度<55bp的reads。如图3所示,统计所有符合条件的R1 reads 5’段比对到基因组上的位置,如果R1 比对到正义链,则整合位点为reads的起始位置,若R1 比对到反义链,则整合位点为reads的终止位置。统计每个位点上符合的reads数量。将300bp范围内多个整合位点合并,300bp范围内各个位点对应的support reads加和,报出频率最高位点位置以及加和后的support reads。以加和后support reads>=10 作为阳性整合位点判定值。
整合位点信息注释
对上述步骤中检测得到的整合位点进行注释:1)注释整合位点在基因的功能区域;2)注释整合位点距离转录起始位点的距离;3) 注释整合位点距离CpG岛距离;4)注释整合位点所在基因是否为癌基因或抑癌基因。
人基因组上CpG岛区域信息从UCSC下载;抑癌基因、癌基因列从OncoKB下载。
整合位点安全性评估
统计样本中阳性整合位点在基因Intergenic、promoter、5’UTR、exon、intron或downstream等功能区上数量分布;统计样本中阳性整合位点与TSS距离分布;统计样本中阳性整合位点与CpG到距离分布;统计样本中阳性整合位点所在基因为抑癌/癌基因的数量。
整合位点多样性分析
统计阳性整合位点在不同染色体上的频数;因为各个染色体长度不一,根据各个染色体长度校正每条染色体上整合位点频数,校正公式为
基于校正后的各染色体上整合位点发生频率,计算香农指数和基尼系数用以评估整合位点在基因组上分布的多样性。香农多样性指数的计算公式为:。其中,S表示总的整合事件数目,pi表示第i个整合事件占总数的比例。基尼系数计算公式 />。n表示总的整合事件数目,xi表示第i个整合事件占总数的比例。
分析方法性能评估结果
对实验室方案开发和验证过程中样本进行统计分析,共计54个样本,合计检测出2619个位点,其中阳性位点个数为72个。
混淆矩阵如表1所示,统计得到,本慢病毒整合位点生物信息分析方法,准确度(Accuracy) 为 99.43%;敏感度为100%;特异性为99.41%。
表1
实施例2、本发明方法对CART注射液样品的检测
采用CART注射液样本1例作为测试样品。经建库并测序后,得到样本原始fastq文件R1.raw.fastq和R2.raw.fastq。经过本整合位点检测方法进行分析后, 详细步骤同实施例1, 统计整合位点信息,经分析共鉴别出3161例高可信度整合事件,其中78(2.47%)个分布于外显子区域,215(6.80%)个分布于致癌/抑癌基因区域,920(29.10%)个分布于TSS上游10Kb以内,776(24.54%)个位于CpG岛附近10Kb以内。通过对整合位点基因组位置特征分析,在内含子区域的整合事件相对较多,而启动子、5’UTR、外显子区域和3’UTR等区域中的整合事件相对较少。通过对肿瘤相关基因与背景基因比较,整合事件分布无显著性差异,推测整合位点在肿瘤相关基因上的整合不具有倾向性。经统计学指标香农指数和基尼系数衡量整合事件在基因组上的分布多样性,样本表现出较高的香农指数和较低的基尼系数,整合事件在基因组上呈均衡分布。

Claims (10)

1. 一种检测慢病毒整合位点的生物信息检测方法,包括:
S1、慢病毒整合位点数据过滤和预处理,其中,包括
1)过滤测序文件;
2)筛选R1 序列的前20-42bp LTR序列与参考LTR序列之间 mismatch <= 1bp的reads;
3)筛选R2 序列的前35-47bp Linker序列与参考Linker序列之间 mismatch <= 1bp的reads;以及
S2、慢病毒整合位点信息检测和评估,其中,包括
4)与参考基因组进行比对,得到在参考基因组上的比对结果;
5)过滤没有比对到参考基因组的reads;过滤mapq<30的reads; 过滤比对到基因组上长度小于55bp的reads; 统计R1比对到基因组上位置;合并300bp范围整合位点;统计各个位点对应的support reads 数量和UMI数量;过滤整合位点supportreads<10的位点;
6)注释整合点所在基因的功能区域;距转录起始位点的距离;距CpG岛的距离;所在基因是否为癌基因或抑癌基因;
7)进行评估。
2.根据权利要求1所述的生物信息检测方法,其特征在于,所述步骤1)具体包括对测序下机得到的fastq文件去除接头,删除read末端测序错误的N碱基;删除过滤后长度低于47bp的reads。
3. 根据权利要求1所述的生物信息检测方法,其特征在于,所述S1还包括获取R2中包含的UMI序列,并过滤UMI中包含C碱基的reads,以及裁剪由于文库过短导致R1/R2 测通,导致R1 3’端包含R2的Linker序列,R2 3’端导致包含LTR序列。
4. 根据权利要求1所述的生物信息检测方法,其特征在于,所述步骤4)具体包括使用Bowtie2设置--very-sensitive --no-mix参数,得到paired-end在参考基因组上的比对结果。
5.根据权利要求1所述的生物信息检测方法,其特征在于,所述步骤7)具体包括校正整合位点在各个染色体上的频率,并计算基尼系数和香农指数,评估整合位点的多样性和安全性。
6. 一种检测慢病毒整合位点的生物信息的设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现如权利要求1~5中任一项所述的检测慢病毒整合位点的生物信息检测方法。
7.根据权利要求6所述的检测慢病毒整合位点的生物信息的设备,其特征在于,所述设备还包括至少一个输入设备和至少一个输出设备;在所述设备中,所述处理器、存储器、输入设备、输出设备之间通过总线连接。
8.一种检测慢病毒整合位点的生物信息的存储介质,所述存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现如权利要求1~5中任一项所述的检测慢病毒整合位点的生物信息检测方法。
9. 根据权利要求8所述的检测慢病毒整合位点的生物信息的存储介质,其特征在于,所述存储介质为计算机可读存储介质。
10. 一种检测慢病毒整合位点的生物信息的装置,包括
数据过滤和预处理模块,包括
1)过滤测序文件;
2)筛选R1 序列的前20-42bp LTR序列与参考LTR序列之间 mismatch <= 1bp的reads;
3)筛选R2 序列的前35-47bp Linker序列与参考Linker序列之间 mismatch <= 1bp的reads;以及
慢病毒整合位点信息检测和评估模块,包括
4)与参考基因组进行比对,得到在参考基因组上的比对结果;
5)过滤没有比对到参考基因组的reads;过滤mapq<30的reads; 过滤比对到基因组上长度小于55bp的reads; 统计R1比对到基因组上位置;合并300bp范围整合位点;统计各个位点对应的support reads 数量和UMI数量;过滤整合位点supportreads<10的位点;
6)注释整合点所在基因的功能区域;距转录起始位点的距离;距CpG岛的距离;所在基因是否为癌基因或抑癌基因;
7)进行评估。
CN202310671349.7A 2023-06-08 2023-06-08 一种检测慢病毒整合位点的生物信息检测方法及其应用 Active CN116403647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310671349.7A CN116403647B (zh) 2023-06-08 2023-06-08 一种检测慢病毒整合位点的生物信息检测方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310671349.7A CN116403647B (zh) 2023-06-08 2023-06-08 一种检测慢病毒整合位点的生物信息检测方法及其应用

Publications (2)

Publication Number Publication Date
CN116403647A CN116403647A (zh) 2023-07-07
CN116403647B true CN116403647B (zh) 2023-08-15

Family

ID=87014659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310671349.7A Active CN116403647B (zh) 2023-06-08 2023-06-08 一种检测慢病毒整合位点的生物信息检测方法及其应用

Country Status (1)

Country Link
CN (1) CN116403647B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012116658A2 (zh) * 2011-03-02 2012-09-07 深圳华大基因科技有限公司 组装基因组序列的方法和装置
CN103261442A (zh) * 2010-12-02 2013-08-21 深圳华大基因健康科技有限公司 Hpv 精确分型的生物信息学分析的方法及系统
WO2015040075A1 (en) * 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
CN105653893A (zh) * 2015-12-25 2016-06-08 北京百迈客生物科技有限公司 一种基因组重测序分析系统及方法
EP3409788A1 (en) * 2017-06-01 2018-12-05 Siemens Healthcare GmbH Method and system for nucleic acid sequencing
CN109554447A (zh) * 2018-12-19 2019-04-02 武汉波睿达生物科技有限公司 慢病毒载体在car-t细胞中的整合位点分析方法及引物
CN110322925A (zh) * 2019-07-18 2019-10-11 杭州纽安津生物科技有限公司 一种预测融合基因产生新生抗原的方法
CN110923325A (zh) * 2019-12-30 2020-03-27 阅尔基因技术(苏州)有限公司 用于检测EGFR基因突变的引物Blocker组、试剂盒及方法
CN111508561A (zh) * 2019-07-04 2020-08-07 北京希望组生物科技有限公司 同源序列和同源序列中串联重复序列的检测方法、计算机可读介质和应用
WO2021243289A1 (en) * 2020-05-29 2021-12-02 The General Hospital Corporation Systems and methods for stable and heritable alteration by precision editing (shape)
CN114480504A (zh) * 2021-12-28 2022-05-13 宁波熙宁检测技术有限公司 Claudin18.2报告基因CHO-K1稳转细胞株构建和应用
WO2023066255A1 (zh) * 2021-10-18 2023-04-27 深圳市真迈生物科技有限公司 测序方法、测序数据处理方法、设备和计算机设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103261442A (zh) * 2010-12-02 2013-08-21 深圳华大基因健康科技有限公司 Hpv 精确分型的生物信息学分析的方法及系统
WO2012116658A2 (zh) * 2011-03-02 2012-09-07 深圳华大基因科技有限公司 组装基因组序列的方法和装置
WO2015040075A1 (en) * 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
CN105653893A (zh) * 2015-12-25 2016-06-08 北京百迈客生物科技有限公司 一种基因组重测序分析系统及方法
EP3409788A1 (en) * 2017-06-01 2018-12-05 Siemens Healthcare GmbH Method and system for nucleic acid sequencing
CN109554447A (zh) * 2018-12-19 2019-04-02 武汉波睿达生物科技有限公司 慢病毒载体在car-t细胞中的整合位点分析方法及引物
CN111508561A (zh) * 2019-07-04 2020-08-07 北京希望组生物科技有限公司 同源序列和同源序列中串联重复序列的检测方法、计算机可读介质和应用
CN110322925A (zh) * 2019-07-18 2019-10-11 杭州纽安津生物科技有限公司 一种预测融合基因产生新生抗原的方法
CN110923325A (zh) * 2019-12-30 2020-03-27 阅尔基因技术(苏州)有限公司 用于检测EGFR基因突变的引物Blocker组、试剂盒及方法
WO2021243289A1 (en) * 2020-05-29 2021-12-02 The General Hospital Corporation Systems and methods for stable and heritable alteration by precision editing (shape)
WO2023066255A1 (zh) * 2021-10-18 2023-04-27 深圳市真迈生物科技有限公司 测序方法、测序数据处理方法、设备和计算机设备
CN114480504A (zh) * 2021-12-28 2022-05-13 宁波熙宁检测技术有限公司 Claudin18.2报告基因CHO-K1稳转细胞株构建和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Unbiased detction of off-target cleavage by CRISPR-Cas9 and TALENs using integrase-defective lentiviral vectors;Xiaoling wang et al.;《Nature biotechnology》;第33卷;175-178 *

Also Published As

Publication number Publication date
CN116403647A (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
EP3889962B1 (en) Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
US12385097B2 (en) Normalizing tumor mutation burden
US8271206B2 (en) DNA sequence assembly methods of short reads
JP2022169566A (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
CN110600078B (zh) 一种基于纳米孔测序检测基因组结构变异的方法
CN103080333B (zh) 一种基因组结构性变异检测方法和系统
CN112349346B (zh) 检测基因组区域中的结构变异的方法
CN112513292B (zh) 基于高通量测序检测同源序列的方法和装置
CN114574581A (zh) 检测稀有突变和拷贝数变异的系统和方法
WO2015051006A2 (en) Phasing and linking processes to identify variations in a genome
CN109920480B (zh) 一种校正高通量测序数据的方法和装置
WO2023115662A1 (zh) 一种变体核酸的检测方法
CN115312121B (zh) 靶基因位点检测方法、装置、设备及计算机存储介质
CN117577182B (zh) 一种快速识别药物标识位点的系统及其应用
CN116403647B (zh) 一种检测慢病毒整合位点的生物信息检测方法及其应用
CN115512767A (zh) 一种检测和分析单细胞转录组测序数据中病毒表达量的方法
Freedman et al. Rethinking eco‐evo studies of gene expression for non‐model organisms in the genomic era
Liu et al. Large haplotypes highlight a complex age structure within the maize pan-genome
JP5946277B2 (ja) アセンブリ誤り検出のための方法およびシステム(アセンブリ誤り検出)
Liu et al. Profiling of RNA editing events in plant organellar transcriptomes with high‐throughput sequencing
CN118173172A (zh) 基于二代测序的基因融合分析方法、产品及应用
WO2023184330A1 (zh) 基因组甲基化测序数据的处理方法、装置、设备和介质
CN116312769B (zh) 一种过滤低复杂度高通量测序数据的装置、方法及计算机可读存储介质
CN120299518A (zh) 测序数据的分析方法、装置、设备和计算机可读存储介质
CN112102885B (zh) 用于确定dna样本甲基化水平的方法、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant