方差与标准差


方差与标准差

文章插图
标准差(StandardDeviation) , 也称均方差(meansquareerror) , 是各数据偏离平均数的距离的平均数 , 它是离均差平方和平均后的方根 , 用σ表示 。标准差是方差的算术平方根 。标准差能反映一个数据集的离散程度 。平均数相同的 , 标准差未必相同 。方差是各个数据与平均数之差的平方的平均数 。公式:1、方差s=[(x1-x)^2+(x2-x)^2+(xn-x)^2]/n(x为平均数)2、标准差=方差的算术平方根它们的意义:1、方差的意义在于反映了一组数据与其平均值的偏离程度;2、方差是衡量随机变量或一组数据时离散程度的度量 。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度 。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数 。3、方差的特性在于:方差是和中心偏离的程度 , 用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差 。在样本容量相同的情况下 , 方差越大 , 说明数据的波动越大 , 越不稳定 。4、标准差是方差的算术平方根 , 意义在于反映一个数据集的离散程度 。
我们可以代入期望的数学表达形式 。比如连续随机变量:
Var(X)=E[(X?μ)2]=∫+∞?∞(x?μ)2f(x)dx
方差概念背后的逻辑很简单 。一个取值与期望值的“距离”用两者差的平方表示 。该平方值表示取值与分布中心的偏差程度 。平方的最小取值为0 。当取值与期望值相同时 , 此时不离散 , 平方为0 , 即“距离”最小;当随机变量偏离期望值时 , 平方增大 。由于取值是随机的 , 不同取值的概率不同 , 我们根据概率对该平方进行加权平均 , 也就获得整体的离散程度——方差 。
方差的平方根称为标准差(standard deviation, 简写std) 。我们常用σ表示标准差
σ=Var(X)??????√
标准差也表示分布的离散程度 。
正态分布的方差
根据上面的定义 , 可以算出正态分布
E(X)=1σ2π??√∫+∞?∞xe?(x?μ)2/2σ2dx
的方差为
Var(X)=σ2
正态分布的标准差正等于正态分布中的参数σ 。这正是我们使用字母σ来表示标准差的原因!
excel的标准差函数是:STDEVP函数 。
使用STDEVP函数的方法:
1、首先点击选中需要计算标准差的单元格位置 , 并选择上方的“fx”图标插入函数 。
2、在插入函数对话框中输入STDEVP , 并在查找到的结果中双击STDEVP开启函数参数设置 。
3、在打开的参数设置对话框中选中需要计算标准差的单元格区域 , 可以根据需要自行选中 。
4、点击确定后即可对应生成标准差 , 针对多组数据可以向下填充公式生成批量的计算结果 。
标准差的两种计算公式如下:
std(A):
std(A)函数求解的是最常见的标准差 , 此时除以的是N-1 。
此函数命令不能对矩阵求整体的标准差 , 只能按照行或者列进行逐个求解标准差 , 默认情况下是按照列 。
在MATLAB主窗口中输入std(A)回车 , 结果如下:
输出的是每一列的标准差 。
std(A , flag):
这里flag代表的是用哪一个标准差函数 , 如果取0 , 则代表除以N-1 , 如果是1代表的是除以N , 
我们在MATLAB主窗口中输入std(A , 1)回车 , std(A , 0) 。
std(A , flag , dim):
【方差与标准差】第三个参数代表的是按照列求标准差还是按照行求标准差 , std(A , 1 , 1)代表的是按照列求标准差 , std(A , 1 , 2)代表的是按照行求标准差 。

    推荐阅读