最常用的模型与原理都介绍完了,之前的内容大概率可以应付毕业的需求。不过有的小可爱们可能会继续做研究,或者是导师给的模型比较难,所以萜妹还会再更新部分有难度的模型,比如跨层模型。


现实背景

跨层模型其实是个发展的趋势,就近原则的取样方式会导致样本的质量有限,能联系公司或团队填写肯定对质量更有保障。

但是嵌套于团队的数据并非完全独立,他们会受一些共同因素影响。下面是一些小例子~

  • 员工幸福感除了受个人因素影响外, 也跟领导的风格有关,真诚待人的领导和霸道、专制的领导肯定不一样。
  • 学生成绩除了跟自身努力程度有关,还可能受到每个学校教学水平不同的影响。

另外,日记法最终也是采用跨层的逻辑在进行数据处理。此时,个体变成了level2的变量,而每天汇报的数据变成了level1的。

  • 体重变化与每天的运动量、食物摄取量有关,但是这也受个人体质影响。比如有的人喝水都胖,但也有人狂吃不胖(好气啊!)

不跨层的弊端

如果我们不将其识别成跨层模型,那么有可能会得到错误的结论。萜妹就以体重为例。

假设现在有5个人,记录他们两天的食物热量与体重情况,如下表所示:

姓名 食物热量 体重 食物热量 体重
A 2100 101 2500 103
B 1900 102 2300 104
C 1700 103 2100 105
D 1500 104 1900 106
E 1300 105 1700 107

(注:热量单位为千卡,体重单位为斤。这个例子的数据并不科学,大家意会一下~)

这个时候,如果不分层,用这10个数据做回归,结果会变成这样:

img

Y=-0.00166X+107.1667

这斜率竟然是个负的!那不是意味着吃的越多,反而能越轻(哪里会有这么好的事!),所以很明显,这不合理对吧。

那么,我们如果分组后再进行分析又会得到什么样的结果呢?

img

个体间(Level 2):Y=-0.005X+113.5

个体内(Level 1):Yj=0.005X+bj

上述的截距各不相同,因为每个人的特质不同啊。

当然,这也是一种比较理想的状态。体质不同,大家吸收情况不一样,所以现实中的斜率也并不会完全相同。

跨层数据中每个组别的斜率和截距都是所特有的,他们遵循着回归分析的规律。**但是如果不加区分将所有的数据放一起进行回归分析,那组内的这些因素关系可能被掩埋,得出的结论也有可能是错误的。**所以,当数据具有嵌套关系时,我们有做跨层分析的必要!

常见模型

下面主要是列举一些常见跨层模型。

类型 I 被中介的调节

img

2-1-1 ★

img

2-2-1

img

1-1-1

类型Ⅱ被中介的调节

img

M 在 level 2 ★

img

M 在 level 1

被调节的中介

图片

2-1-1

图片

2-2-1

这两个模型,既可以被视为被中介的调节模型,也可以被视为被调节的中介模型。

img

1-1-1 ★

img

2-1-1

除了1-1-1以外,其他三个模型的中介效应仅存在于level 2。

以上标★的三个模型最为常见,萜妹以前详细介绍过它们的原理与语句,所以这里就不再展开说明。

有兴趣的小可爱可以在往期推送中回顾!

常见误区

误区1:变量可以自下而上进行调节

除了上述模型外,现实中还有其他的模型。但是有一些可能在数理上无法完美契合,比如下图这个。

img

有一些已发表的文章,用的类似这样的模型,它在现实中确实也挺常见的。比如,不同特质的个体可能对领导风格有不同的反应。

但是,为什么萜妹还要单独说它,因为它其实是不符合数理逻辑的。原因如下:

首先,我们要明白,数理上 X 是不能影响 M 的,X 能影响的只有 M 的均值

我们假设,X是学校的教学水平,M是学生成绩。

这是不是听起来还挺合理的,教学水平确实会影响学生成绩,好像能解释的通。但是,我们仔细思考一下:同一个学校的同学,他们成绩完全一样吗?大概率是不一样的对吧。

学校 学生 教学水平 学生成绩
A A1 60 480
A A2 60 520
A A3 60 440
B B1 80 600
B B2 80 580

此时,一个X对应了多个M,并且M不完全是因为随机误差而导致的不同,那么还能说 X 和 M 之间存在着因果关系吗?

所以,X 对 M 的影响其实是在level 2 发生的,教学水平能实际影响的是学生的平均成绩。平均成绩虽然来源于每个学生的成绩,但是二者是不同的。

那弄清楚 X 对 M 的作用方式后,又有一个新的问题:level 1 的 W 是怎么影响 level 2 的关系的?

代入例子中:学校教学水平与学校平均成绩的关系,会受到某个学生学习动机的影响吗?

学校 学生 教学水平 学生成绩 平均成绩 学习动机
A A1 60 480 480 70
A A2 60 520 480 90
A A3 60 440 480 70
B B1 80 600 590 90
B B2 80 580 590 85

如果学习动机可以影响的话,那为什么不同的 W 却会对应相同的 X 和 M,即对于学校A,主效应是已经确定了的,但是 A1 与 A2 调节变量的取值又是不一样的。这说明不同的 W 无法导致 X 与 M 的关系变化,与调节效应的原理相悖。

所以,调节变量是不可以自下而上进行调节的!

上述模型在实际处理过程中,还没有完全符合数理逻辑的解决方法。如果实在想用这种模型,可以考虑:①将所有变量放在level 1;②将所有变量放在 level 2。

误区2:被中介的调节模型中自变量和调节变量可以位于不同层次

img

上图模型是不可以被视为被中介的调节模型的!

在类型 I 的被中介的调节模型中,需检验XW的系数,那么,X 与 W 应该具有系统对称性,即双方相互影响。

但实际上,X并不能影响 W 与 M 的关系,而 X 与 M 的关系却会随着 W 的取值而变化,这其实是被调节的中介模型的检验逻辑。

所以该模型只能是前半段被调节的中介模型,而无法成为被中介的调节模型。


啦啦啦,这篇推送就到这里啦。想把跨层单独拿出来写,第一是因为目前的趋势,单层有时候会被质疑;第二是因为它重要,一般培训都会单独介绍它;第三是,前阵子萜妹了解到SPSS也有了跨层分析的插件Mlmed,而且据说跟process一样比较好上手,所以想着掌握后给小可爱们介绍一下。

虽然目前,萜妹使用那个插件还在不停报错,但是我应该能在一周内研究出来……吧。当然,如果有已经掌握的小可爱,跟我沟通救救我更好!

那小可爱们,我们下周见吧~

往期推送

➪笔记丨Multi-level Moderation

➪笔记丨Multi-level Mediation

➪笔记丨Cross-level MeMo

➪笔记丨Cross-level MoMe

➪笔记丨多层线性模型(一)

原文链接:

➪干货丨假设分析之跨层模型