iNAP 2.0提供了三种方法来量化GSMMs之间的代谢相互作用:PhyloMint、SMETANA和基于pFBA的代谢距离。与基于物种丰度的共现网络类似,这些代谢相互作用指数可以通过筛选并构建成微生物代谢网络。本节将解释每种方法的原理和解释。
方法1:PhyloMint
PhyloMint使用GSMMs来预测基因组之间的竞争和互补性(MIcompetition和MIcomplementarity)的代谢指数。对于每个GSMM,首先预测一组种子化合物,即一组无法在模型中内源合成的最小化合物子集(代谢模型中的强连通组分,SCC)。然后,使用公式计算基因组对之间的竞争和互补性指数。
步骤3 PhyloMint:程序计算n个输入GSMMs(步骤2-A/B的输出)之间的MIcompetition/MIcomplementarity,生成n2组指数。这些指数显示了两个模型在代谢功能上共享部分以及一个模型能利用另一个模型释放的物质的程度。参数MaxCC表示SCC集合的最大大小(默认值:5,仅影响竞争系数)。PhyloMint的结果是一个包含4列的表格,显示基因组对及其MIcompetition和MIcomplementarity。
步骤4 PhyloMint PTM:按照计算公式定义,MIcomplementarity指数代表一个模型能利用另一个模型的代谢物质的潜力。潜在可转移代谢物(PTMs)定义为一个模型的种子化合集和另一个模型的非种子化合集的交集。这一步以压缩模型集(步骤2-A/B的输出)和PhyloMint结果(步骤3的输出)作为输入,并以表格文件的形式输出这些物质,显示每个化合物的供体和受体以及它们在BiGG数据库中的命名和完整索引。必须注意,如果使用的GSMMs不是由CarveMe生成的,文件扩展名可能是SBML格式,用户需要在这一步更改格式或扩展名。
步骤5 Create PhyloMint Matrix:这一步将步骤4生成的结果从表格形式转换为矩阵形式,用于网络阈值确定。特别是,我们为不对称的MI指数提供两种处理模式:(1)保留原始值,即直接将步骤4的结果转换为不对称矩阵。使用此矩阵构建的代谢相互作用网络将是有向的;(2)选择每对模型的成对指数中的较大值来表示模型之间的相互作用强度,以使得生成的矩阵是对称的,使用它构建的代谢相互作用网络将是无向的。我们将(2)设为默认,并推荐使用基于RMT的方法进行网络阈值确定。
方法2:SMETANA
SMETANA是一个通过计算群落中代谢资源的重叠和最小生长需求代谢物来量化群落内的竞争和互补性的工具。SMETANA可以模拟由两个及以上GSMMs组成的群落,因此程序(步骤7和8)需要一个表格来指示给定模型集中哪些GSMMs属于一个群落。在iNAP 2.0平台上,SMETANA分析的模型限制为300个。
步骤6 Create Community List:为了计算GSMMs之间的成对相互作用,iNAP 2.0提供了一个给定模型集中所有GSMMs成对的所需表格(步骤2-A/B的输出),这将用作步骤7(-A/B)和8(-A/B)的输入。
步骤7-A SMETANA Global:对于给定的群落,SMETANA定义了两个指数,代谢资源重叠(MRO)和代谢互作潜力(MIP),分别代表群落的竞争和互补性水平。这些指数的具体定义和计算已经在以往文献中详细描述。可以使用SMETANA的global模式计算这些指数。这一步的输入应是压缩的基因组集和在步骤6输出的表格。
步骤7-B Iterative SMETANA Global:SMETANA的开发者已经确认它的一个bug,即每次运行的结果可能会略有不同。这种不一致性是由于CPLEX solver的solution pool特性造成的。开发者建议可以多次运行并计算均值以代表最终结果。为了实现这一点,我们设计了此步骤,将步骤7-A运行2-10次,并输出平均结果。
步骤8-A SMETANA Detailed:除了使用MRO/MIP量化群落的代谢互作外,SMETANA还提供了detailed模式来计算一系列指数,以进一步量化物种间的相互作用。这些指数包括:物种偶联得分(SCS)、代谢物吸收得分(MUS)、代谢物产生得分(MPS)以及结合了三个指数的SMETANA得分,以代表群落中物种间依赖性的总和。本步骤的输入要求与步骤7-A一致。
步骤8-B Iterative SMETANA Detailed:重复计算的原因与步骤7-B相同。
步骤9 Create SMETANA Matrix:这一步将SMETANA MIP/MRO的结果从表格转换为两个矩阵,用于网络阈值确定。该步骤需要群落列表(步骤6的输出)和SMETANA global模式的结果(步骤7-A/B的输出)作为输入文件。
方法3:代谢距离(Metabolic Distance)
先前的研究表明,代谢距离(代谢不相似性)在形成和决定微生物群落中的协同作用中至关重要。
步骤10 Metabolic distance:此步骤根据Giri等人描述的方法计算GSMMs之间的成对代谢距离。这一步的输入是压缩的模型集(步骤2-A/B的输出)。具体来说,该程序首先对每个模型进行流平衡分析(FBA),以反应为优化(最大化)biomass反应通量(目标函数,通常用于代表生长速率反应)。该步骤也可以选择优化其他目标函数,如ATP产量,代表不同的代谢策略。默认设置下,iNAP 2.0选择CarveMe中的“Growth”反应,代表由CarveMe生成的GSMMs中的增长率反应。随后,优化的生物量反应通量被固定,进行简约FBA(pFBA)以最小化每个模型中绝对通量之和,同时约束目标函数(如生物量生产)达到初始FBA获得的最优值。随后,选择在至少一个模型中通量不为零的反应作为代表,生成模型的通量向量,并计算它们之间的欧几里得距离来表征代谢距离。这一步骤有3个输出:2个距离矩阵(原始欧几里得距离和标准化欧几里得距离)和原始欧几里得距离的3列表格(模型A/模型B/欧几里得距离)。最先考虑使用原始欧几里得距离。在矩阵包含许多相差数量级的数值(当同时输入用不同通量上下限的设置构建的模型时会发生,我们非常不建议用这样的模型集)的情况下,可以考虑使用标准化欧几里得距离矩阵。