上世纪末完成的“人类基因组项目”揭示人类基因数量大约是两万多(据2018年一项发表于Nature的估计:包括21306蛋白质编码基因)。2010年代发起的“人类菌群宏基因组项目”发现肠道菌群所携带的细菌基因大约是人类自身基因数量的150倍,也就是300万左右(据另一项发表于Nature的研究)。近日,马占山学科组采用自己所发明的新算法(已经获得三项国家发明专利授权)对相关数据重新分析后发现,先前关于“人类宏基因多样性”的结果可能是被严重低估了。这些结果在算法专利授权之后,最近也公开发表出了系列论文(其论文和专利清单见本文末)。
他们最新的研究发现,人类(作为一个群体)仅肠道细菌(不包括皮肤等其它身体部位,也不包括病毒等其它微生物类群)所携带宏基因数量(种类)大约应该是在430万至690万之间;而人体(单个个体)宏基因数量大约是50-97万之间;而人与人之间宏基因种类差别的“标准误”(Standard Error)竟然高达60-75万。也就是说人类在宏基因数量差异的幅度大概是单个人体宏基因的数量。他们的研究还发掘出了其它一堆有趣的数字,例如“优势”宏基因数量,“典型”宏基因的数量等等。实际上,正如论文题目(Toward a unified diversity–area relationship of species and gene diversity illustrated with the human gut metagenome)所提示的, 这项研究是建立了度量物种多样性和基因多样性的统一方法,并提出了“潜在宏基因多样性”(也称‘暗’多样性)的概念和估计方法。事实上,2018年之前(Ma ZS & Li LW, 2018, Molecular Ecology Resources, vol. 18:1339–1355) 对于宏基因多样性缺乏系统度量指标和方法,先前研究所公布数字自然受到了当时估计方法的限制。
这些听起来枯燥的数据其实值得科学家、乃至普通民众思考,或许可以启发出更加有趣的科学假设,乃至改变我们对宏基因研究的探索方向和方法。一些显而易见、但目前仍缺乏严格科学意义上的答案的问题包括:为什么人类基因数量也就两万多,而人类宏基因数量却是数百万?而且人与人之间宏基因数量差别也有数十万,而人与人之间基因数量应该是基本相同的。例如,普通人别说是缺少一个基因,就是一个基因某个核酸位点突变了,或许会有“大难临头”(例如癌细胞突变),而同样一个人跟别人相比缺少几万个宏基因可能根本就没有任何影响。再举一个类似例子:一位每天冲澡两次的人和另一位两天冲澡一次的人,他们每天(因沐浴)失去皮肤微生物所携带的宏基因数量可能会有显著差异,但这些习惯通常不会对他们健康和疾病有什么影响。因此,对于目前大量关于肠道菌群对健康和疾病影响的研究所揭示的差别或许应该是持“谨慎和释然”并存的态度。一方面,科学家在揭示其差异的生物医学意义时候应该是更加谨慎;而大众对于其差异也可以比较释然,对于极少数宣称通过改善肠道菌群就能包治疾病的广告也应该谨慎相信。
科学意义上,也是在上述研究发现启示下,在一篇仍在同行评审的论文中,马占山团队提出了将宏基因分为“driver”和“passenger”等类别的假设。他们区别是,前者可能与人类(宿主)有协同进化作用,而后者则仅仅是“过客”。他们所承受的进化选择压力可能非常不同。就像有些地方,要求出租车司机必须使用安全带,而后排的乘客则可以自主选择。
该系列论文作者包括学科组博士生陈红菊、肖琬蒙、乔玉亭等,以及来自昆明医科大学、昆明理工大学、美国哈佛大学的数位教授和主任医生。研究得到国家自然科学基金等资助。
相关论文:
[1] Xiao WM et al. (2021) Diversity Scaling Analysis of Chinese Gut Microbiomes Across Ethnicities and Lifestyles. Frontiers in Microbiology. Vol. 12:736393. Doi: 10.3389/fmicb.2021.736393
[2] Chen HJ et al. (2021) Diversity Scaling of Human Digestive Tract (DT) Microbiomes: The Intra-DT and Inter-individual Patterns. Frontiers in Genetics, 12:724661. Doi: 10.3389/fgene.2021.724661
[3] Ma ZS* & AM Ellison (2021) Toward a unified diversity–area relationship (DAR) of species and gene diversity illustrated with the human gut metagenome. Ecosphere. Vol. 12(11): Doi:10.1002/ecs2.3807
相关授权发明专利:
[1] 一种基于多样性指数和区域范围关系的幂法则标度模型预测微生物群落结构的方法,
专利号:CN201710949841.0
[2] 一种基于Hill numbers与时间关系的幂法则模型预测微生物群落结构的方法,
专利号:CN201711223008.4
[3]一种基于多样性指数与时空关系的幂法则标度模型预测微生物群落结构变化的方法,
专利号:CN201711289534.0