科研动态     首页 > 新闻动态 > 科研动态
马占山学科组系列研究为“宏基因医学生态学”领域提供基础支撑
2024-09-09 来源:计算生物与医学生态学学科组 作者:

基因生态学研究基因变异与生态因素之间的相互作用,探索环境条件如何影响基因表达和进化过程。这个跨学科领域整合了遗传学、生态学和进化生物学,以研究种群和生态系统内遗传多样性的适应性意义。主要关注点包括理解基因如何影响生物体对环境变化的反应、自然选择在塑造遗传多样性中的作用,以及增强生存和繁殖能力的性状的遗传基础。通过研究基因-环境相互作用,基因生态学为生物多样性保护、进化动态和气候变化对遗传资源的影响提供了重要见解。

过去10余年,宏基因测序技术的发明将基因生态学推向了对人体屏障组织(barrier tissue,例如皮肤、消化道、呼吸道等)、内脏组织(如肿瘤组织、血液等)、动植物个体-种群-群落、土壤、森林、湖泊、海洋、乃至冰川等自然生态系统中菌群的研究。宏基因测序主要产生两类数据:增子(Amplicon) 测序产生的分类操作单元OTU (Operational Taxonomic Unit)”,以及全基因(whole-genome metagenomic sequencing or shotgun-sequencing)测序产生的宏基因数据。与前者相比,后者产出数据量要高出数个数量级。例如,人体肠道OTU 数量如果是万级的话,其宏基因数量可能是百万、乃至千万级。差别更大的是,前者产生的其实是微生物种类(或者)其它分类单元的清单,而后者产生的本质上是微生物所携带的基因清单。它们之间其实有一些本质上的差别:就像比较生物个体和个体所携带的基因,基因本质上可以理解为信息或者软件,而生物有机体则通常是有血有肉硬件。软件依附于硬件,但硬件则依赖于软件的精准调控才能正常运转。

可以说,大量宏基因数据的突然出现,当时并没有现成的理论和数据分析技术,而宏基因数据分析则仅仅是借鉴了基因组分析方法,使得宏基因数据分析严重受限,本来可以从大数据中获得的信息并没有得到充分挖掘。其主要限制因子之一则是缺乏系统理论基础和系统的分析技术。与基因生态有一定差别的是,对单个基因或者数个基因的研究通常是集中在其功能和调控研究,对于数量高达百万、乃至千万宏基因的研究如果离开了对其所采集环境的基本评估,则其研究几乎是无从下手,这一特殊之处意味着宏基因组学研究首先是一个生态学问题。

2018年马占山与李连伟合作在《Molecular Ecology Resources》发表了该领域第一篇系统分析宏基因多样性的分析方法。近日发表在《BMC Bioinformatics》和《Computers in Biology and Medicine》完成了该系列研究的大部分理论和技术基础。例如OMU (Operational Metagenomic Unit) 概念及其基于集合论OMU定义为系统引入生态学理论和方法奠定了基础,同时也统一了目前宏基因数据分析中众多基因单元,对于改变宏基因组学目前大致是数据驱动而不是理论假设驱动的研究方法应该会有较大帮助!又例如最新发表的宏基因比较框架(Metagenome Comparison framework) ”为从百万、乃至千万级别的宏基因清单中超出与某种疾病相关联的特有/富集基因提供了高效可行的计算技术和软件。这些类似于大海捞针的技术当然也可以移植于基因组、单细胞转录组数据等组学数据的类似分析。

迄今学科组已经发表了专注于宏基因生态的五篇论文,同时实现了这些理论和分析技术与分析扩增子测序(如大家熟悉的用于鉴定细菌的16S测序技术)的统一。过去10余年,虽然学界大量采用生态学理论和方法研究菌群,特别是临床医学领域有点“着迷”的“微生态学”,但这些研究主要集中在对扩增子测序数据的分析,而采用生态学理论和方法对宏基因本身的研究则仅限于零星应用,并没有形成系统性的研究方法。究其原因,一是缺乏系统理论探索,同样重要的障碍是宏基因测序大数据分析难度远超过基因大数据分析难度。例如,基于16S数据的网络分析已经与计算菌群多样性一样普及,但实现宏基因网络分析仍然是巨大难题。马占山学科组在数年前就曾经借助于目前AI领域最热门的GPU计算技术完成了宏基因网络相关系数的计算,但这些相关系数本身就需要数10T空间储存。如此大数据量,目前网络分析软件根本无法完成可视化操作,其后续计算分析也是举步维艰。因此,他们在该领域发表的五篇技术性论文中首先要解决的技术难题是如何使得计算可行。即使在采用了一些特殊算法处理,其中不少计算在普通生物信息计算平台通常也需要数月才能完成。这些论文采用了同一批发表在2012年前后的人类肠道菌群宏基因组数据,系统的示范了学科组提出的一些独特医学生态学概念和相应的分析方法、以算法和软件形式呈现了宏基因医学生态学的基本框架,并将其与菌群医学生态学(主要是基于扩增子测序数据分析)整合,从而形成统一的、适用于微生物有机体和其携带的宏基因组的生态学领域。与传统医学生态学不同的是,新兴的医学生态学高度依赖于计算生物信息学、医学微生物学、理论生态学等姊妹学科。另一方面,医学生态学也可能为动物疾病生态学、肿瘤生物学、植物保护等领域提供借鉴(例如马占山与张亚平院士发表的综述Ma & Zhang 2022)。

近期出版的相关论文

Ma ZS (2024) Metagenome comparison (MC): A new framework for detecting unique /enriched OMUs (operational metagenomic units) derived from whole-genome sequencing reads. Computers in Biology and Medicine, Vol. 179.

Ma ZS (2024) Towards a unified medical microbiome ecology of the OMU for metagenomes and the OTU for microbes. BMC Bioinformatics,

Ma ZS, Li LW & Chen HJ (2024) Unique and enriched microbes and their potential “allies and foes” in the human gut microbiomes of ASD patients. Research in Autism Spectrum Disorders, Vol. 117.

Ma ZS & Shi P (2024) Critical complex network structures in animal gastrointestinal tract microbiomes. Animal Microbiome

Ma ZS & Li LW (2024) Biodiversity metrics on ecological networks: demonstrated with animal gastrointestinal microbiomes. Zoological Research: Diversity and Conservation.

Chen, HJ., Li, LW, Yu, FB., & Ma, ZS (2024). A comprehensive diversity analysis on the gut microbiomes of ASD patients: from alpha, beta to gamma diversities. FEMS Microbiology Letters, Vol. 371, fnae014.

近期发布的相关预印本

Ma ZS, Li, LW & Mei, JD (2024) Detecting microbiome species unique or enriched in 20+ cancer types and building cancer microbiome heterogeneity networks.

https://www.medrxiv.org/content/10.1101/2024.03.23.24304768v1

Ma ZS (2024) Immune-oncology-microbiome axis may result in AKP or anti-AKP effects in intratumor microbiomes. https://www.medrxiv.org/content/10.1101/2024.03.23.24304783v1

Li, LW & Ma ZS (2024) Estimating the selection pressure of tumor growth on tumor tissue microbiomes. https://www.medrxiv.org/content/10.1101/2024.03.17.24304406v1

Ma ZS (2024) Tumor and pan-tumor diversity and heterogeneity of cancer tissue microbiomes: a medical ecology analysis across 32 cancer types. https://www.medrxiv.org/content/10.1101/2024.03.17.24304446v1

Ma ZS (2024) How many microbial species are there in human tumor and normal tissues?

https://www.medrxiv.org/content/10.1101/2024.04.16.24305922v1

近年来出版的宏基因生态学基础论文

Ma, ZS, & Li, LW (2018). Measuring metagenome diversity and similarity with Hill numbers. Molecular Ecology Resources, 18(6), 1339-1355.

Ma, ZS (2020). Assessing and interpreting the metagenome heterogeneity with power law. Frontiers in Microbiology, 11, 648.

Ma, ZS, & Ellison, A. M. (2021). Toward a unified diversity–area relationship (DAR) of species and gene diversity illustrated with the human gut metagenome. Ecosphere, 12(11), e0380

Ma, ZS, & Zhang, YP (2022). Ecology of human medical enterprises: from disease ecology of zoonoses, cancer ecology through to medical ecology of human microbiomes. Frontiers in Ecology and Evolution, 10, 879130.

Ma, ZS, & Zhang, YP (2022). Ecology of human medical enterprises: from disease ecology of zoonoses, cancer ecology through to medical ecology of human microbiomes. Frontiers in Ecology and Evolution, 10, 879130.

Ma ZS (2024) Metagenome comparison (MC): A new framework for detecting unique /enriched OMUs (operational metagenomic units) derived from whole-genome sequencing reads. Computers in Biology and Medicine, Vol. 179.


Copyright © 2018- 中国科学院昆明动物研究所 .All Rights Reserved
地址:云南省昆明市盘龙区茨坝街道龙欣路17号  邮编:650201
电子邮件:yangxi@mail.kiz.ac.cn
滇ICP备05000723-1号       滇公网安备 53010202000920号