科研动态     首页 > 新闻动态 > 科研动态
孙艳波博士发布生物序列处理工具FasParser2
2018-03-12 来源:两栖爬行类多样性与进化学科组 作者:孙艳波

  从大量的序列数据中挖掘有用的生物学信息,已成为众多研究领域的必备手段,这就需要我们掌握一些常用的序列处理操作。针对序列的处理,已有一些优秀的工具包供使用,大致可以分为两类:一类是命令行程序,如EMBOSS等,这一类工具的特点是运行速度较快,灵活性很高,可以和其他工具融合形成分析流程和批处理化。然而,这类工具往往需要用户熟悉Unix-like操作系统的使用,甚至要求用户具有编写脚本的能力。另一类是窗口程序,如MEGA、BioEdit等,这一类工具具有友好的用户操作界面,使用起来非常方便,但是它们往往只能对单文件进行操作,且很难和其他程序形成自动化分析流程,导致它们难以应付越来越多的序列文件。基于此,中国科学院昆明动物研究所/两栖爬行类多样性与进化研究组的孙艳波博士于2017年在《Zoological Research》发布了FasParser程序,以实现在友好的界面窗口下对一些常规序列操作,尤其像多基因的串联合并、序列的提取、低质量序列的鉴定等,进行批处理化。 

  近日,孙艳波博士对FasParser进行了较大幅度的更新,并以“FasParser2: A Graphical Platform for Batch Manipulation of Tremendous Amount of Sequence Data”于生物信息学国际期刊《Bioinformatics》在线发布了新版本(链接地址:https://doi.org/10.1093/bioinformatics/bty126),以满足科研人员对序列操作更高的需求。最新程序(v2.3.0)可在该地址免费下载:https://github.com/Sun-Yanbo/FasParser/releases。 

  增加的功能主要包括:1)  重新设计的文件上传界面具有更好的批处理效率;2)   增加了有效过滤序列比对质量的模块,尤其适用于大规模检测序列中经历达尔文正选择的位点,以及重建系统发育等分析;3) 增加若干序列过滤的功能,可实现序列中对非同源序列的清除,尤其适用于从一堆数据中抽取感兴趣的序列;4)  增加了蛋白序列的一些操作接口,如利用蛋白序列的比对结果生成DNA的比对结果等;5) 增加了检测正选择(借助于PAML)、PCR引物设计(借助于Primer3)的功能;6) 增加了专门的序列编辑工具(FasParser::Editor),以实现更方便的序列查看和编辑功能;以及7)其他一些附属功能。 

  该工作得到了国家自然科学基金面上项目、中国科学院战略先导专项(B)、以及中国科学院青年创新促进会的支持。 

 


Copyright © 2018- 中国科学院昆明动物研究所 .All Rights Reserved
地址:云南省昆明市盘龙区茨坝街道龙欣路17号  邮编:650201
电子邮件:yangxi@mail.kiz.ac.cn
滇ICP备05000723-1号       滇公网安备 53010202000920号