协方差 协方差与协方差系数的公式?

【协方差 协方差与协方差系数的公式?】协方差科技名词定义
中文名称协方差:协方差 英文名称:covariance 定义1:变量xk和xl如果均取n个样本,则它们的协方差定义为 ,这里 分别表示两变量系列的平均值 。协方差可记为两个变量距平向量的内积,它反映两气象要素异常关系的平均状况 。
应用学科:大气科学(一级学科);气候学(二级学科) 定义2:度量两个随机变量协同变化程度的方差 。应用学科:遗传学(一级学科);群体、数量遗传学(二级学科) 以上内容由全国科学技术名词审定委员会审定公布
求助编辑百科名片
协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法 。
方差分析是从质量因子的角度探讨因素不同水平对实验指标影响的差异 。一般说来,质量因子是可以人为控制的 。回归分析是从数量因子的角度出发,通过建立回归方程来研究实验指标与一个(或几个)因子之间的数量关系 。但大多数情况下,数量因子是不可以人为加以控制的 。
目录
协方差定义
协方差属性
协方差矩阵
在农业上应用
编辑本段协方差定义
在概率论和统计学中,协方差用于衡量两个变量的总体误差 。
而方差是协方差的一种特殊情况,即当两个变量是相同的情况 。期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量X与Y之间的协方差定义为:其中,E是期望值 。它也可以表示为:直观上来看,协方差表示的是两个变量总体的误差,这与只表示一个变量误差的方差不同 。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值 。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值 。
如果X与Y是统计独立的,那么二者之间的协方差就是0 。这是因为 协方差 公式
[1]但是,反过来并不成立 。即如果X与Y的协方差为0,二者并不一定是统计独立的 。协方差cov(X,Y)的度量单位是X的协方差乘以Y的协方差 。
而取决于协方差的相关性,是一个衡量线性独立的无量纲的数 。协方差为0的两个随机变量称为是不相关的 。
编辑本段协方差属性
两个不同参数之间的方差就是协方差 若两个随机变量X和Y相互独立,则E[(X-E(X))(Y-E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系 。
定义E[(X-E(X))(Y-E(Y))]称为随机变量X和Y的协方差,记作COV(X,Y),即COV(X,Y)=E[(X-E(X))(Y-E(Y))] 。协方差与方差之间有如下关系:D(X Y)=D(X) D(Y) 2COV(X,Y)D(X-Y)=D(X) D(Y)-2COV(X,Y)因此,COV(X,Y)=E(XY)-E(X)E(Y) 。
协方差的性质:(1)COV(X,Y)=COV(Y,X);(2)COV(aX,bY)=abCOV(X,Y),(a,b是常数);(3)COV(X1 X2,Y)=COV(X1,Y) COV(X2,Y) 。由协方差定义,可以看出COV(X,X)=D(X),COV(Y,Y)=D(Y) 。
协方差作为描述X和Y相关程度的量,在同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲使它们的协方差在数值上表现出很大的差异 。为此引入如下概念:定义ρXY=COV(X,Y)/√D(X)√D(Y),称为随机变量X和Y的相关系数 。
定义若ρXY=0,则称X与Y不相关 。即ρXY=0的充分必要条件是COV(X,Y)=0,亦即不相关和协方差为零是等价的 。定理设ρXY是随机变量X和Y的相关系数,则有(1)∣ρXY∣≤1;(2)∣ρXY∣=1充分必要条件为P{Y=aX b}=1,(a,b为常数,a≠0)定义设X和Y是随机变量,若E(X^k),k=1,2, 。
。。存在,则称它为X的k阶原点矩,简称k阶矩 。若E{[X-E(X)]^k},k=1,2, 。。。存在,则称它为X的k阶中心矩 。若E(X^kY^l),k、l=1,2, 。。。存在,则称它为X和Y的k l阶混合原点矩 。若E{[X-E(X)]^k[Y-E(Y)]^l},k、l=1,2, 。
。。存在,则称它为X和Y的k l阶混合中心矩 。显然,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩,协方差COV(X,Y)是X和Y的二阶混合中心矩 。
编辑本段协方差矩阵
分别为m与n个标量元素的列向量随机变量X与Y,二者对应的期望值分别为μ与ν,这两个变量之间的协方差定义为m×n矩阵 。
两个向量变量的协方差cov(X,Y)与cov(Y,X)互为转置矩阵 。协方差有时也称为是两个随机变量之间“线性独立性”的度量,但是这个含义与线性代数中严格的线性独立性线性独立不同 。
编辑本段在农业上应用
协方差在农业上的应用农业科学实验中,经常会出现可以控制的质量因子和不可以控制的数量因子同时影响实验结果的情况,这时就需要采用协方差分析的统计处理方法,将质量因子与数量因子(也称协变量)综合起来加以考虑 。

推荐阅读