RDA 代表什么的缩写?( 二 )


(1)执行物种spe1与环境变量env1的线性回归(由于此处示例中仅存在一个环境解释变量,故此回归为一元线性回归;当存在多解释变量时,即为多元线性回归),将回归模型拟合的物种丰度值存储在拟合值矩阵,物种丰度的残差存储在残差矩阵 。见下图1中所示的过程 。
(2)如此对物种组成矩阵中的所有物种重复相同的操作,最终获得包含所有物种丰度拟合值及残差的两个矩阵 。见下图2中所示的两个矩阵 。(1)(2)过程即形象化地展示了RDA中的回归细节部分 。
(3)回归过程执行完毕后,使用PCA,在拟合值矩阵中提取约束的排序轴,并在残差值矩阵中提取非约束的轴 。见下图2中所示的过程,在该示例中,由于仅有一个解释变量(环境变量env1),因此仅得到一个约束的排序轴(排序图中的垂直轴是第一个非约束轴) 。
RDA排序结果产生的约束轴的数量为min[p, m, n - 1];如果同时获得非约束排序结果(即PCA),则非约束轴数量为min[p, n - 1] 。其中,p为响应变量数量;m为定量解释变量数量以及定性解释变量(因子变量)的因子水平的自由度(即该变量因子水平数减1);n为排序对象数量 。
从上述解释计算RDA的步骤中即可看出,RDA的排序轴实际上是解释变量的线性组合(即线性模型拟合值的排序) 。换句话说,RDA的目的是寻找能最大程度解释响应变量矩阵变差的一些列的解释变量的线性组合,因此RDA是被解释变量约束的排序 。约束排序与非约束排序的区别很明显:约束排序过程中解释变量矩阵控制排序轴的权重(特征根)、正交性和方向 。在RDA中,排序轴解释或模拟(从统计意义上讲)依赖矩阵(响应变量)的变差,并可以检验响应变量矩阵Y与解释变量矩阵X的线性相关显著性;非约束排序PCA分析则不存在这种情况 。尽管在非约束模型中,可以通过在排序后被动地加入解释变量以达到解释排序轴的目的( 详见前文 ),但此举与约束排序相比具有本质区别 。
在群落分析中,对于非约束排序模型(如 PCA ),我们感兴趣的信息主要是排序图中样方和物种变量得分的相对位置、部分排序轴的相对重要性(根据特征值判断)以及排序轴的生态解释等;而对于约束排序模型(如RDA),我们通常更关注环境变量对物种组成的影响(即环境变量所能解释的变差,以及 解释程度的显著性 )、哪些环境变量对于群落结构的解释更为重要( 变量选择 )以及获知各变量或变量集解释的变差(变差分解)等 。这些相关的延伸(也很重要)内容不在本文中介绍,若有需要可点击对应链接阅读 。
通常情况下我们在执行RDA时(如使用R语言vegan包的rda()函数运行RDA),能够同时获得约束轴(即解释变量能够解释的部分,以约束轴呈现)和非约束轴(即解释变量未能解释的部分,多元回归的残差部分,该部分以非约束轴呈现)两部分信息,原始响应变量矩阵的总变差为约束轴解释变差和非约束轴解释变差的加和 。
同前述非约束排序 PCA ,在RDA概念中,变差=方差 。
约束模型解释变差反映了响应变量变化量的多少与解释变量有关,如果用比例表示,其值相当于多元回归的R2,这个解释比例值也称作双多元冗余统计(Bimultivariate redundancy statistic) 。然而,类似于多元回归的未校正R2,RDA的R2也是有偏差的,需要进行校正 。
同时,并非每一个约束轴都是合理有效的,还需依据置换的原理检验各约束轴的显著性,对约束轴进行取舍( 详见前文 ) 。因此,与非约束模型 PCA 等的非约束轴等不同,RDA约束轴的评判方法比较严格,若约束轴未通过检验,则不应被选择 。(PCA只是探索性分析方法,非约束轴的选择并无严格的标准;RDA已经涉及了统计检验的过程,显著性通过p值衡量)
如上所述,也就是约束轴未能解释的,多元回归的残差部分,额外以非约束PCA轴作为呈现 。对RDA进行解读时,最好同时结合约束轴和非约束轴中的信息,尽管非约束部分严格来讲不属于RDA范畴,但很多情形中仍具参考价值 。
群落分析中,常通过RDA描述环境变量(解释变量)解释样方物种组成(响应变量)的差异 。如果约束轴解释的变差大于非约束轴解释的变差,表明响应数据的大部分变化量均可通过解释变量作出解释,群落物种组成分布真实地由给定环境因子所影响(对于RDA结果,即二者呈现出较好的线性梯度);如果约束轴解释变差低于非约束轴解释变差,或者约束轴解释变差仅占总变差的较小比例,此时应谨慎对待,因为模型并未显示出给定环境因子能够对群落物种的组成作出有效的解释 。

推荐阅读