CN109584965A - 一种转基因食品的交叉式基因组重组排序方法 - Google Patents
一种转基因食品的交叉式基因组重组排序方法 Download PDFInfo
- Publication number
- CN109584965A CN109584965A CN201811572396.1A CN201811572396A CN109584965A CN 109584965 A CN109584965 A CN 109584965A CN 201811572396 A CN201811572396 A CN 201811572396A CN 109584965 A CN109584965 A CN 109584965A
- Authority
- CN
- China
- Prior art keywords
- genome
- sequence
- gene
- arrangement
- indexing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005215 recombination Methods 0.000 title claims abstract description 26
- 230000006798 recombination Effects 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 19
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 39
- 210000000349 chromosome Anatomy 0.000 claims abstract description 22
- 238000006073 displacement reaction Methods 0.000 claims abstract description 16
- 238000003780 insertion Methods 0.000 claims abstract description 13
- 230000037431 insertion Effects 0.000 claims abstract description 13
- 230000002068 genetic effect Effects 0.000 claims abstract description 10
- 239000012634 fragment Substances 0.000 claims abstract description 6
- 230000002441 reversible effect Effects 0.000 claims abstract description 6
- 238000012217 deletion Methods 0.000 claims description 5
- 230000037430 deletion Effects 0.000 claims description 5
- 230000009261 transgenic effect Effects 0.000 claims description 3
- 230000001351 cycling effect Effects 0.000 claims description 2
- 230000003252 repetitive effect Effects 0.000 claims description 2
- 101150118163 h gene Proteins 0.000 claims 1
- 239000007787 solid Substances 0.000 claims 1
- 108700026220 vif Genes Proteins 0.000 claims 1
- 230000009466 transformation Effects 0.000 abstract description 4
- 238000004904 shortening Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108700026215 vpr Genes Proteins 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种转基因食品的交叉式基因组重组排序方法。主要包括:将一个反转操作作用在基因片段上,形成新的染色体,并通过插入得到基因组的最优反转序列;构建染色体森林,设立间接极小子排列树,计算基因组移位删除距离公式,推导出移位插入距离公式,进行交互式移位排序;在基因组的序列上进行转位操作,通过分裂使转位排序距离最小,完成基因组转位排序。该方法具有较好的精简性和普适性,设立间接极小子排列树进行交互式反转、移位和转位排序,给出基因组重组的多项式精确算法,降低算法的时间复杂度,缩短重组的基因组排列,通过最少的操作将源基因转化为目标基因组。
Description
技术领域
本发明涉及基因组重组、转基因技术、生物领域,具体涉及一种转基因食品的交叉式基因组重组排序方法。
背景技术
转基因食品利用基因重组技术,在打破物种原有基因排序的基础上重新排序组合,形成我们所希望呈现出某些性状的基因组。现有的基因组重组技术时间负责度较大,而且由于缺乏对于重组分析等技术的解决方法使得基因组中几个基因位于同一个位置或者遗漏其他基因,将其结合起来仅能产生基因组的部分排序而不是最优排序,无法满足对转基因食品具有的性状的需求。
发明内容
为解决上述问题,本发明的目的在于提供一种具有较好的精简性和普适性的转基因食品的交叉式基因组重组排序方法,设立间接极小子排列树进行交互式反转、移位和转位排序,给出基因组重组的多项式精确算法,降低算法的时间复杂度,缩短重组的基因组排列,通过最少的操作将源基因转化为目标基因组。
本发明解决其问题所采用的技术方案,包括以下步骤:
A.将一个反转操作作用在基因片段上,形成新的染色体,并通过插入得到基因组的最优反转序列;
B.构建染色体森林,设立间接极小子排列树,计算基因组移位删除距离公式,推导出移位插入距离公式,进行交互式移位排序;
C.在基因组的序列上进行转位操作,通过分裂使转位排序距离最小,完成基因组转位排序。
本发明的有益效果是:
在基因组重组排序越来越重要的情况下,本发明具有较好的精简性和普适性,设立间接极小子排列树进行交互式反转、移位和转位排序,给出基因组重组的多项式精确算法,降低算法的时间复杂度,缩短重组的基因组排列,通过最少的操作将源基因转化为目标基因组。
附图说明
图1为一种转基因食品的交叉式基因组重组排序方法的整体流程图;
图2为基因组的森林结构图;
图3为基因组转位排序流程图。
具体实施方式
参照图1,本发明所述的方法包括以下步骤:
A.将一个反转操作作用在基因片段上,形成新的染色体,并通过插入得到基因组的最优反转序列;
(3)转基因食品就是人工控制基因组的序列重组,基因组重组主要有:反转、移位、转位、插入、删除,反转和转位操作是作用在单条染色体上,而移位操作则作用在两条染色体上。给定一条染色体X={x1,x2,…,xi-1,xi,…,xj,xj+1,…,xn},将一个反转操作r(i,j)作用在基因片段(xi,xi+1,…,xj-1,xj)上,形成新的染色体X′={x1,x2,…,xi-1,-xj,…,-xi,xj+1,…,xn}。
| X | x<sub>1</sub> | x<sub>2</sub> | … | x<sub>i-1</sub> | x<sub>i</sub> | … | x<sub>j</sub> | x<sub>j+1</sub> | … | x<sub>n</sub> |
| X′ | x<sub>1</sub> | x<sub>2</sub> | … | x<sub>i-1</sub> | -x<sub>j</sub> | … | -x<sub>i</sub> | x<sub>j+1</sub> | … | x<sub>n</sub> |
反转能够颠倒染色体上的部分基因序列,将该基因序列中基因排序倒置的同时将基因的符号变反。
(4)设立转基因生物体基因序列A和外源基因序列B之间的反转距离为d,用集合H表示即在A中又在B中的基因集合,HA和HB分别表示只在A中和只在B中的基因集合,去掉HA和HB中的所有基因,则有:
反转排序便是寻找一组使基因组A转化为基因组B最少的反转序列r。将剩余基因组A′,B′用有向图表示,结合两个有向图,构造双色图G(A′,B′),然后将去掉的HA和HB中的基因放回恰当的位置,从而得到A和B的一个全排序,产生最优的反转序列。
B.构建染色体森林,设立间接极小子排列树,计算基因组移位删除距离公式,推导出移位插入距离公式,进行交互式移位排序;
(3)基因组A={x1,x2,…,xn}中含有n条染色体,每条染色体及其所有的子序列构建染色体森林Fx,则基因组的森林为:
FA=Fx1∪Fx2∪…∪Fxn
如图2所示,若极小子排列是间接的,用实心圆点表示,否则用空心圆点表示。基因组的一个极小子排列是森林的一个叶子节点,叶子节点数量为L,极小子排列不包含任意其他子排列。对于基因组A和B,若都包含N条染色体和n个基因,将A重组为B所需的最小移位操作次数为:
dt=n-N-c+L
其中,c是基因组A和B有向图中环的数量。
(4)基因组A到基因组B′的移位删除排序操作的距离公式为:
其中,A′是基因组A去掉HA基因剩余的基因,B′是基因组B去掉HB
基因剩余的基因,r是间接极小子排列的个数,p是有向图中不能被消除的间接极小子排列的个数。基因组A到基因组B的移位插入排序操作的距离公式为:
基因组的移位步骤为:首先删除A中的HA基因,执行移位排序操作,得到从A到B的删除序列,将从A到B的删除序列转化为从B到A的插入序列,然后进行回填,若开始在元素xa、xb中删除了基因序列片段,而xa、xb中如果没有集合A′中的元素序列,便回填在元素xa、xb之间或集合A′中的元素序列之间,否则直接回填,最后执行插入排序操作,从而得到移位排序。
C.在基因组的序列上进行转位操作,通过分裂使转位排序距离最小,完成基因组转位排序。
(3)基因组转位排序操作是在基因组A={x1,x2,…,xn}的序列上进行转位ρ(i,j,k)将子排列{xi,xi+1,…,xj-1}从排列中取出后插入到xk-1和xk之间,其中1≤i<j<k≤n+1。即将排列转换为另一个排列,转位排序便是寻找一组转位,使转位排序距离最小。若有:
xi+1≠xi+1
则点对(xi,xi+1)是断点P。因此需要减少排列中断点的数量。若排列中每个元素xi用两个顶点表示:
l(xi)=2xi-1
r(xi)=2xi
且将0和2n+1分别作为第一个和最后一个顶点,可以得到包含2n+2个元素的顶点序列,P(xi)的顶点集为{0,1,…,2n+1}。
(4)转位操作要对排列xi进行排序,必须将其断点图P(xi)中圈的个数c(xi)增加到n+1,一次转位操作ρ引起圈的数量变化为:
Δc(ρ)=c(xiρ)-c(xi)
一个操作在简单排列上的(x,y)序列,至少有y个是3转位,并且转位序列操作后剩下一个简单排列,其中x≥y。若一个排列对应的断点图中只包含2圈,则这样的排列为2排列,转位的简单排列与反转的简单排列相同,每个排列可以通过分裂变成简单排列。设立排列xi包含一个长度操作3的圈C,设立断点图有两种类型的边:灰边和黑边,b1是圈C的一条黑边,经过灰边直接和b1连接的两条黑边为b2和b3,灰边g和b2相连但不与b1相连。则(g,b3)分裂将圈C分裂形成一个3圈和一个(k-2)圈,重复循环分裂的过程,直至得到简单排列,从而完成基因组转位排序。
综上所述,便完成了本发明所述的一种转基因食品的交叉式基因组重组排序方法。该方法具有较好的交互性和普适性,设立间接极小子排列树进行交互式反转、移位和转位排序,给出基因组重组的多项式精确算法,降低算法的时间复杂度,缩短重组的基因组排列,通过最少的操作将源基因转化为目标基因组。
Claims (4)
1.一种转基因食品的交叉式基因组重组排序方法,其特征在于:设立间接极小子排列树进行交互式反转、移位和转位排序,所述方法包括以下步骤:
A.将一个反转操作作用在基因片段上,形成新的染色体,并通过插入得到基因组的最优反转序列;
B.构建染色体森林,设立间接极小子排列树,计算基因组移位删除距离公式,推导出移位插入距离公式,进行交互式移位排序;
C.在基因组的序列上进行转位操作,通过分裂使转位排序距离最小,完成基因组转位排序。
2.根据权利要求1所述的一种转基因食品的交叉式基因组重组排序方法,其特征在于:
所述步骤A包括:
(1)给定一条染色体X={x1,x2,...,xi-1,xi,...,xj,xj+1,...,xn},将一个反转操作r(i,j)作用在基因片段(xi,xi+1,...,xj-1,xj)上,形成新的染色体X′={x1,x2,…,xi-1,-xj,…,-xi,xj+1,…,xn},
反转能够颠倒染色体上的部分基因序列,将该基因序列中基因排序倒置的同时将基因的符号变反;
(2)设立转基因生物体基因序列A和外源基因序列B之间的反转距离为d,用集合H表示即在A中又在B中的基因集合,HA和HB分别表示只在A中和只在B中的基因集合,去掉HA和HB中的所有基因,则有:
反转排序便是寻找一组使基因组A转化为基因组B最少的反转序列r,将剩余基因组A′,B′用有向图表示,结合两个有向图,构造双色图G(A′,B′),然后将去掉的HA和HB中的基因放回恰当的位置,从而得到A和B的一个全排序,产生最优的反转序列。
3.根据权利要求2所述的一种转基因食品的交叉式基因组重组排序方法,其特征在于:
所述步骤B包括:
(1)基因组A={x1,x2...,xn}中含有n条染色体,每条染色体及其所有的子序列构建染色体森林Fx,则基因组的森林为:
FA=Fx1∪Fx2∪…∪Fxn
基因组的一个极小子排列是森林的一个叶子节点,叶子节点数量为L,极小子排列不包含任意其他子排列,对于基因组A和B,若都包含N条染色体和n个基因,将A重组为B所需的最小移位操作次数为:
dt=n-N-c+L
其中,c是基因组A和B有向图中环的数量;
(2)基因组A到基因组B′的移位删除排序操作的距离公式为:
其中,A′是基因组A去掉HA基因剩余的基因,B′是基因组B去掉HB基因剩余的基因,r是间接极小子排列的个数,p是有向图中不能被消除的间接极小子排列的个数,基因组A到基因组B的移位插入排序操作的距离公式为:
基因组的移位步骤为:首先删除A中的HA基因,执行移位排序操作,得到从A到B的删除序列,将从A到B的删除序列转化为从B到A的插入序列,然后进行回填,若开始在元素xa、xb中删除了基因序列片段,而xa、xb中如果没有集合A′中的元素序列,便回填在元素xa、xb之间或集合A′中的元素序列之间,否则直接回填,最后执行插入排序操作,从而得到移位排序。
4.根据权利要求3所述的一种转基因食品的交叉式基因组重组排序方法,其特征在于:
所述步骤C包括:
(1)基因组转位排序操作是在基因组A={x1,x2,...,xn}的序列上进行转位ρ(i,j,k)将子排列{xi,xi+1,...,xj-1}从排列中取出后插入到xk-1和xk之间,其中1≤i<j<k≤n+1,即将排列转换为另一个排列,转位排序便是寻找一组转位,使转位排序距离最小,若有:
xi+1≠xi+1
则点对(xi,xi+1)是断点P,因此需要减少排列中断点的数量,若排列中每个元素xi用两个顶点表示:
l(xi)=2xi-1
r(xi)=2xi
且将0和2n+1分别作为第一个和最后一个顶点,可以得到包含2n+2个元素的顶点序列,P(xi)的顶点集为{0,1,...,2n+1};
(2)转位操作要对排列xi进行排序,必须将其断点图P(xi)中圈的个数c(xi)增加到n+1,一次转位操作ρ引起圈的数量变化为:
Δc(ρ)=c(xiρ)-c(xi)
一个操作在简单排列上的(x,y)序列,至少有y个是3转位,并且转位序列操作后剩下一个简单排列,其中x≥y,若一个排列对应的断点图中只包含2圈,则这样的排列为2排列,转位的简单排列与反转的简单排列相同,每个排列可以通过分裂变成简单排列;设立排列xi包含一个长度操作3的圈C,设立断点图有两种类型的边:灰边和黑边,b1是圈C的一条黑边,经过灰边直接和b1连接的两条黑边为b2和b3,灰边g和b2相连但不与b1相连;则(g,b3)分裂将圈C分裂形成一个3圈和一个(k-2)圈,重复循环分裂的过程,直至得到简单排列,从而完成基因组转位排序。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201811572396.1A CN109584965A (zh) | 2018-12-21 | 2018-12-21 | 一种转基因食品的交叉式基因组重组排序方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201811572396.1A CN109584965A (zh) | 2018-12-21 | 2018-12-21 | 一种转基因食品的交叉式基因组重组排序方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN109584965A true CN109584965A (zh) | 2019-04-05 |
Family
ID=65931281
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201811572396.1A Pending CN109584965A (zh) | 2018-12-21 | 2018-12-21 | 一种转基因食品的交叉式基因组重组排序方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109584965A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118522347A (zh) * | 2024-07-23 | 2024-08-20 | 江西师范大学 | 基于同源性分析和区域加权的线粒体基因组重排量化方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1813063A (zh) * | 2003-05-01 | 2006-08-02 | 独立行政法人科学技术振兴机构 | 将固定于载体上的物质附加染色体的顺序或排列位置信息进行排列的阵列及其制造方法、使用阵列的分析系统及其应用 |
| US20100304990A1 (en) * | 2007-07-16 | 2010-12-02 | Gifford David K | Ruler arrays |
| CN105243297A (zh) * | 2015-10-09 | 2016-01-13 | 人和未来生物科技(长沙)有限公司 | 一种参考基因组上基因序列片段的快速比对定位方法 |
-
2018
- 2018-12-21 CN CN201811572396.1A patent/CN109584965A/zh active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1813063A (zh) * | 2003-05-01 | 2006-08-02 | 独立行政法人科学技术振兴机构 | 将固定于载体上的物质附加染色体的顺序或排列位置信息进行排列的阵列及其制造方法、使用阵列的分析系统及其应用 |
| US20100304990A1 (en) * | 2007-07-16 | 2010-12-02 | Gifford David K | Ruler arrays |
| CN105243297A (zh) * | 2015-10-09 | 2016-01-13 | 人和未来生物科技(长沙)有限公司 | 一种参考基因组上基因序列片段的快速比对定位方法 |
Non-Patent Citations (8)
| Title |
|---|
| ERIC TANNIER 等: "Advances on sorting by reversals", 《DISCRETE APPLIED MATHEMATICS》 * |
| NIKLAS ERIKSEN 等: "Estimating the expected reversal distance after a fixed number of reversals", 《ADVANCES IN APPLIED MATHEMATICS》 * |
| THAYNARA ARIELLYDE LIMA 等: "On the average number of reversals needed to sort signed permutations", 《DISCRETE APPLIED MATHEMATICS》 * |
| 冯建兴: "转位排序和块交换排序的改进算法", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》 * |
| 尹晓: "基因组重组排序问题的算法研究", 《中国博士学位论文全文数据库 基础科学辑》 * |
| 郝凡昌: "有向基因组复合操作重组排序算法研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
| 郝凡昌: "通过交互式移位-插入-删除进行基因组排序的较快算法", 《计算机研究与发展》 * |
| 陈宏宇 等: "含有反转、删除或插入操作的部分排序基因组重组", 《上海应用技术学院学报(自然科学版)》 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118522347A (zh) * | 2024-07-23 | 2024-08-20 | 江西师范大学 | 基于同源性分析和区域加权的线粒体基因组重排量化方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11788156B2 (en) | Compositions comprising riboregulators and methods of use thereof | |
| Glémin et al. | Pervasive hybridizations in the history of wheat relatives | |
| Wang et al. | Comparative analysis of mitochondrial genomes of five aphid species (Hemiptera: Aphididae) and phylogenetic implications | |
| Mallya et al. | Packnet: Adding multiple tasks to a single network by iterative pruning | |
| Bi et al. | HomBlocks: a multiple-alignment construction pipeline for organelle phylogenomics based on locally collinear block searching | |
| Yazdi et al. | DNA-based storage: Trends and methods | |
| Li et al. | Solving the large-scale hybrid flow shop scheduling problem with limited buffers by a hybrid artificial bee colony algorithm | |
| Michel | Circular code motifs in transfer and 16S ribosomal RNAs: a possible translation code in genes | |
| D'yachkov et al. | Exordium for DNA codes | |
| Zhang et al. | The complete mitochondrial genome of Delia antiqua and its implications in dipteran phylogenetics | |
| CN109584965A (zh) | 一种转基因食品的交叉式基因组重组排序方法 | |
| CN118506879A (zh) | 识别模型构建方法、抗菌肽生成方法、装置和存储介质 | |
| Jockusch et al. | Something old, something new, something borrowed, something red: the origin of ecologically relevant novelties in Hemiptera | |
| Lei et al. | Artificial bee colony algorithm for solving multiple sequence alignment | |
| Hirota et al. | A fast algorithm for finding a maximal common subsequence of multiple strings | |
| Choi et al. | Genome assembly, gene content, and plastic gene expression responses to salinity changes in the Brackishwater Clam (Corbicula japonica) from a dynamic estuarine environment | |
| Gilbert et al. | A genome‐wide analysis of the USDA Soybean Isoline Collection | |
| CN103116805B (zh) | 一种更新遗传种群的分段替换方法 | |
| Fresnedo‐Ramírez et al. | A review of plant epigenetics through the lens of almond | |
| KR102380935B1 (ko) | 유전체 영역 검색 시스템 및 방법 | |
| Young et al. | The sequenced genomes of Medicago truncatula | |
| CN113962550A (zh) | 一种求解多种类农机顺序任务优化调度方法 | |
| Yong-Gui et al. | Sequencing and phylogenetic analysis of the Pyrgilauda ruficollis (Aves, Passeridae) complete mitochondrial genome | |
| Yang et al. | Mitochondrial genomes of two pygmy grasshoppers (Orthoptera: Tetrigoidea) and a comparative analysis of Caelifera mitogenomes | |
| US20250372194A1 (en) | Determination of microbiota samples to produce a target mix product and prediction of mixes |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190405 |