几种面板数据模型的解释 面板数据模型

面板数据模型(几种面板数据模型的解释)
1混合效应模型
就是各省都一样 , 就是同一个方程 , 截距项 , 斜率项都一样 。
Yit = c+bxit+it c和b是常数 。
2固定效应模型和随机效应模型 。
即各省有相同的部分 , 即斜率项相同;还有不同的部分 , 也就是不同的截距项 。
2.1固定效应模型
yit=ai+bxit+?it cov(ci , xit)≠0
固定效应方程意味着跨组差异可以用常数项的差异来描述 。每个ai被视为待评估的未知参数 。xit中任何不随时间变化的变量都会模拟因人而异的常数项 。
2.2随机效应模型
yit=a+ui+bxit+?it cov(a+ui , xit)=0
a是常数项 , 是不可观测差的平均值 , ui是第I次观测的随机差 , 不随时间变化 。
3变系数模型(变系数可分为固定效应和随机效应)
每组由一个方程估计 。即各省线性回归方程的截距项和斜率项不同 。
yit=ui+bixit+?it
1.混合估计模型是指每个截面估计方程的截距项和斜率项都是相同的 , 也就是说回归方程的估计结果在截距项和斜率项上都是相同的 。如果我们看每个省 , 历年的收入对消费的影响 。那么每个省份的回归方程是完全一样的 , 无论是截距还是斜率 。
2.随机效应模型和固定效应模型具有相同的斜率项 , 但截距项不同 。区别在于截距项是否与自变量相关 , 不相关选择随机效应模型 , 相关选择固定效应模型 。然后各省回归方程斜率相同 , 不同的是截距项 , 也就是平移项 。
3.变系数模型 , 即无论是截距项还是系数项 , 对于不同的省份 , 每个省份都有一个回归方程 , 最适合自己的 , 不考虑整体 。各省的回归方程无论是斜率还是截距都与其他省份不同 。
简而言之 , 从混合估计模型 , 到变截距模型 , 再到变系数模型 , 被调查的省份完全服从整体 , 没有个性(回归方程是从整体的角度确定和估计的 , 是一刀切的 , 完全没有差异和个性 , 完全牺牲自己) , 到任意的 , 完全个性化的(每个省份都有一个最适合自己的回归方程) 。也就是从完全没有人格到完全人格 。
二、固定效用模型和随机效用模型选择中的一种医友筛选方法 。
关于随机效应模型和固定效应模型的选择 , 通常的做法是对两种模型进行分析 , 看结果是否一致 。如果它是一致的 , 很少或没有异质性 , 选择固定效应模型 。如果结果不一致且异质性 , 选择随机效应模型 , 进行亚组分析寻找异质性来源 , 结论要保守 。几个荟萃分析都说“所有汇总的结果指标都是用随机效应模型确定的” 。在方法学部分 , “所有汇总的结果指标都是用DerSimonian和Laird描述的随机效应模型确定的” 。为什么用随机效应模型而不用固定效应模型?因为RCT的异质性 , 直接用随机效应模型吗?
1.它基于12个值来确定模型的使用 。多数认为> 50% , 存在异质性 。他们用随机效应模型 , ≤50% 。它们是固定的 , 具有异质性 。通过敏感性分析或亚组分析 , 我们可以寻找异质性的来源 。不过两者都是定性的 , 不一定能发现 。即使你做了 , 你也可以做一个元回归来发现异质性 。
2.在任何情况下都要使用随机效应模型 , 因为如果异质性很小 , 随机效应模型和固定效应模型的最终组合结果不会有太大差异 。当异质性较大时 , 只能使用随机效应模型 , 所以可以说无论如何都会使用随机效应模型 。3.还有一个 , 看P值 , 一般建议P的边界值是0.1 , 现在大多用0.05 , 也就是P > 0.05 。
其实个人更喜欢第三种 , 因为P值可以看出是否存在异质性 , I2是定量描述一致性的大小 。
本来随机效应的假设是我们的样本是从一个大母体中抽取的 , 所以大家的期望(平均值)是一样的;如果我们的样本几乎都是妈妈 , 不能说个体差异是随机的 , 那么固定效果更好;这是从模型的设定角度来说的 。但是随机效应模型有一个致命的缺陷 , 就是假设cov(x , ui)=0 , 而固定效应不需要这个假设 。豪斯曼检验所做的就是检验这个假设对于随机效应模型是否成立 。否则 , 随机效应模型的估计是有偏差的 。就算B-P的LM测试显示有随机效应 , 你也不能用 。

推荐阅读