八月中,美国微生物学会旗舰期刊之一《mSystems》发表了中科院昆明动物所马占山研究员关于肠道菌群结构和多样性进化的一篇研究论文。该研究通过超大规模计算模拟,并与文献中已发表的动物和人类肠道菌群宏基因组样本大数据相比较,提出一个假设:肠道菌群的构建和多样性维持机制(参数)从无脊椎动物到脊椎动物再到人类是一个连续进化过程,但在现代人类似乎出现了一个拐点(转折点),这一拐点的出现或许与人类饮食改变,以及人类的高度社会性相关。这一似乎非常简单的假设上线发表后,随即有读者(Joseph Madison 博士)写信提出质疑。近日该信件以及马占山回应线上发表于《mSystems》。两份争论通信以及原文的链接地址见该文末尾。
鉴于围绕该论文的争论刚刚开始,这里仅仅提供与论文相关的一些背景信息,对于其结论此稿不加评述。首先,生物群落结构进化的问题,更加准确的词语应该是叫群落构建(Community Assembly)以及多样性维持机制 (Diversity maintenance) 。宏观(动植物)生物学领域对这一问题的研究最早可以追溯到达尔文经典著作《物种起源》。达尔文《物种起源》的结束段落是这样开始的:
“It is interesting to contemplate an entangled bank, clothed with many plants of many kinds, with birds singing on the bushes, with various insects flitting about, and with worms crawling through the damp earth, and to reflect that these elaborately constructed forms, so different from each other, and dependent on each other in so complex a manner, have all been produced by laws acting around us.”
这里选用网上一段翻译:凝视树木交错的河岸,许多种类的无数植物覆盖其上,群鸟在灌木丛里鸣唱,各种不同的昆虫飞来飞去,蚯蚓在潮湿的泥土里爬过,并且默想一下这些构造精巧的类型,彼此是这样地相异,并以如此复杂的方式相互依存,而它们都是由于在我们周围发生作用的法则产生出来的,这岂非有趣之事。(http://wap.sciencenet.cn/home.php?mod=space&uid=39377&do=blog&id=228802)。据此网文,该译文出自:周建人.叶笃庄.方宗熙《物种起源》1997. 商务印书馆。
达尔文用美丽的比喻描述了一个生机盎然的“生物(态)群落”中物种的多样性。在进化论最早的版本中,达尔文使用了“由作用在我们周围的(自然)定律所形成”(by laws acting around us)。 后来在宗教压力下,改成了“by the Creator”(上帝)。显然,达尔文物种起源虽然解释了物种是如何进化而来,但并没有解释物种之间“平时”(生态时间尺度)是如何相处而形成美丽的景色。 如果深究,达尔文自然选择是说“物竞天择、适者生存”;换句话说,生物物种间竞争应该是无处不在,又怎么会在生机盎然的河岸上和平共处?
二十世纪末生态学家Stephen Hubbell提出了著名的解释生物多样性的“中性理论” (Unified Neutral Theory of Biodiversity: UNTB) 。Hubbell 理论的最大优点是它以严密的数学模型形式呈现,人们可以采用严格的统计假设检验方法验证某一生物群落(菌群)是否符合中性理论。应该说明的是Hubbell理论其实是受Motto Kimura分子进化的中性理论所启示。当然,中性理论并不是唯一解释群落构建机制的理论,目前至少有四大理论。其中最重要的当推1920年代提出的“生态位理论”和20世纪末发展出的中性理论。事实上,中性理论更多的是一个统计检验的零假设模型,最大用处其实是用来检验关于“生物群落构建、以及多样性形成和维持”机制的理论假设。目前生态学家已经提出了将近10个综合中性理论和生态位理论的所谓混合模型。
而在微生物学领域,类似的研究仅仅是近10多年的进展,原因是其研究必须依赖基因测序技术。生态学时间尺度的研究依赖于DNA测序技术,而进化时间尺度的研究则主要依赖于计算机模拟。因为与动植物进化研究不同,微生物进化的化石证据非常罕见。另外,受医学伦理约束,也无法进行人类比较实验研究。虽然Kimura分子进化中性理论本质上是就是对进化论的补充,但将“生物多样性的中性理论”与进化参数做关联分析,本研究确系首次。具体地:该研究分析了动物宿主进化时间(phylogenetic timeline)与肠道菌群多样性形成的机制参数(例如迁徙率,新物种形成率)之间的相关关系。这些计算模型极端耗时,此次发表的结果计算时间接近一年。而计算模拟从动物个体的肠道菌群开始、跨越物种、群落(宏群落)、景观(Landscape)、至全球景观(Global Landscape)等生态系统尺度。
该研究还分析了其结果可能的“I-型”和“II-型”统计错误概率,也就是通常所说的“假阳性”和“假阴性”概率。再考虑到人类从远古时代到现今,所可能食用过的植物从高达3000种到现今大约20种主要种类,而肉类来源则从野生猎物到工业化饲养的畜禽,再加上都市化生活方式,应该对人类肠道菌群结构和进化产生了深刻影响。为此,马占山对Joseph Madison博士提出的批评逐一反驳。而他采用的回应题目基本总结了反驳的观点:对于中性理论或随机性的“怀疑哲学”(Philosophical skepticism) 如果不是错位(mis-placed),可能就是构思错了(mis-conceived)。在回应对中性理论质疑时,马占山提出,所提出的质疑与过去20多年来的争论相比没有什么新意,在连假阳性、假阴性都估计了的情景下,如果还是质疑,就只能是哲学上质疑随机性是否真正存在。对于Madison 质疑马混用Stochastic和Random,马则提醒Madison查一查“亚马逊售书商城”有多少随机过程书名用的是“Introduction to Random (Stochastic) Processes”。这两个词的中文翻译都是“随机”, 数学上中英文也多可混用(例如随机过程这一数学学科)。当然,两个“随机”(Stochastic/Random)也有不同意思的场合,但差别是在非常复杂的计算数学领域,复杂到了什么程度?与哥德尔的不完备定理、图灵的可计算理论、以及与1965年才问世的“算法信息论” 有关。有兴趣读者可阅读下列数学科普网站:
https://plus.maths.org/content/omega-and-why-maths-has-no-toes 。 如果此网页和名词太枯燥,该网站另外一页则应该比较有趣(但与该文稿内容无关,仅供浏览 https://plus.maths.org/content/shower-equation)。
为回应以上提到的“两个随机”有差异的复杂情形,马占山列出了他学生时代的教科书 “An introduction to Kolmogorov complexity and its applications”,也为回应Madison列出的一组对于生物学家可能不太熟悉的词汇(Kolmogorov无穷数列, Bernoulii 测度,σ(Sigma代数)。马并建议 Madison 可以写一篇论文详细讨论这些问题。该教科书被广泛认为是“算法信息论”的经典著作,通常是计算机科学专业博士生最后几门课程(例如“可计算性”理论)的教材之一。
该回应以下面段落结束(对Madison承认自己并不清楚哪个概念更好的回应,并提醒应该避免双标) :If you “do not know which of these conceptions is better” (2), would you please accommodate my being uncertain as expressed by “it appears that,” or “we postulate”? While allowing oneself to enjoy philosophical skepticism, what was wrong with my correlating phylogenetic timeline with stochasticity based on statistical tests? Should potential double standards be avoided?
论文出处:
[1] Ma ZS (2021) Cross-scale analyses of animal and human gut microbiome assemblies from metacommunity to global landscape. mSystems 6: e00633-21. https://doi.org/10.1128/mSystems.00633-21.
[2] Madison JD (2021) Stochasticity and randomness in community assembly: real or as-if? mSystems 6:e00938-21. https://doi.org/10.1128/mSystems .00938-21.
[3] Ma ZS (2021) Philosophical skepticism concerning the neutral theory or randomness: misplaced or misconceived? A reply to Madison, “Stochasticity and randomness in community assembly: real or as-if?” mSystems, mSystems.01014-21. 6:e01014-21. https://doi.org/10.1128/