建立二代测序基因组组装新方法 |
2018-01-15 | 作者: | 来源: 【打印】 |
中科院动物进化与遗传前沿交叉卓越创新中心李雷研究员团队研究发现,在每一迭代过程中,通过自适应地选取序列映射准则,得到可以唯一映射到当前基因组模板上的测序序列,并用它们来延拓每个contig,进行scaffolding,连接相邻的contigs,并更新当前基因组模板。其中,contig的延拓采用了Overlap-Layout-Consensus(OLC)方法,通过并行计算实现。BAUM通过调整唯一性准则,控制基因组中由广泛存在的重复序列导致的不确定性。BAUM拼接方法的核心是以不同的准则反复映射序列,这可以通过SEME方法实现。BAUM以及SEME方法建立在严格的数学、计算、和统计学的概念和逻辑体系之上,此外团队开发了BAUM的模块化程序,提供软件下载。BAUM方法是迭代逼近算法,它可以成为整合不同测序平台数据的方法。这样根据新的测序数据可以持续地改进基因组。该研究成果发表在Bioinformatics上。 |