数据分析丨假设检验
数据分析这个系列,萜妹说过是希望能用通俗的语言,帮助小可爱们搭建数据分析的框架,并且告诉小可爱们要做成什么样,为什么要这么做,以及怎么做。
萜妹把需要做的数据分析分为了三个大类,分别是:数据有效性分析、样本基本描述、数据具体分析。
- 数据有效性分析:信度检验、验证性因子分析、共同方法偏差检验。
- 样本基础描述:描述性分析、相关分析。
- 数据具体分析:回归分析、bootstrap法、简单斜率分析(涉及调节时使用)。
目前萜妹已经介绍完有效性分析与基础描述。假设分析的部分也已经介绍完调节、中介、被调节的中介、被中介的调节的基本原理。那么,我们称热打铁,先把最常用的假设分析操作说了吧~
进行假设分析,萜妹一般都是使用SPSS和Mplus,关于二者的具体操作步骤,萜妹介绍过很多次,可在往期推送中查看。这篇推送主要是结合着文章假设来进行一一验证、说明~
那我们开始吧~
提出假设
在验证假设是否成立之前,我们先要学会如何根据模型提出自己的假设。
以下:X代表自变量、M代表中介变量、Y代表结果变量、W代表调节变量。
【简单中介】
简单的中介模型一般会对应三个假设:
- H1:X 对 M 具有显著影响;
- H2:M 对 Y 具有显著影响;
- H3:M 在 X 和 Y 之间起中介作用。
【简单调节】
简单的调节模型一般会对应两个假设:
- H1:X 对 Y 具有显著影响;
- H2:W 可调节 X 和 Y 之间的关系。
【被调节的中介】(最常见!)
在上述基础上,被调节的中介模型对应假设为:
-
H1:X 对 M 具有显著影响;
-
H2:M 对 Y 具有显著影响;
-
H3:M 在 X 和 Y 之间起中介作用;
-
H4a:W1 可调节 X 和 M 之间的关系;
H4b:W2 可调节 M 和 Y 之间的关系;
-
H5:W1/W2 可调节 X 通过 M 对 Y 的间接效应。
H4a是调节中介效应的前半段,H4b是调节中介效应的后半段,H5则是完整的被调节的中介假设。
【被中介的调节】
最后是被中介的调节模型。由于类型Ⅰ被中介的调节模型与第一阶段被调节的中介模型类似,而通常被调节的中介模型更有理论价值,所以很少有文章以类型Ⅰ被中介的调节模型的逻辑进行假设。
而类型Ⅱ 被中介的调节模型对应假设为:
- H1:X 对 Y 具有显著影响;
- H2:W 可调节 X 和 Y 之间的关系;
- H3:W 对 M 具有显著影响;
- H4:M 可调节 X 和 Y 之间的关系;
- H5:W 可通过 M 调节 X 和 Y 之间的关系。
此时的M,即是中介变量,也是调节变量。H3-H5相当于简单中介模型中的H1-H3,必要时也可合并。此外,H5则是完整的被中介的调节假设。
不过,单独的被中介的调节模型在组织行为学中也不常见,更有可能是嵌套在被调节的中介中,如下图。
那么,此时的假设就应该是:
- H1:X 对 M 具有显著影响;
- H2:M 对 Y 具有显著影响;
- H3:M 在 X 和 Y 之间起中介作用;
- H4:W1 可调节 X 和 M 之间的关系;
- H5:W1 可调节 X 通过 M 对 Y 的间接效应;
- H6:W2 可调节 X 和 M 之间的关系;
- H7:W2 可调节 X 通过 M 对 Y 的间接效应;
- H8:W1 对 W2 具有显著影响;
- H9:W1 可通过 W2 调节 X 和 M 之间的关系;
- H10:W1 可通过 W2 调节 X 通过 M 对 Y 的间接效应。
其中,H5、H7为被调节的中介效应;H9为被中介的调节效应:H10为二者的结合,有时并不提出。
此外,模型较复杂需提出多种假设时,H1、H2可省略,直接提出中介效应的H3也可。
上述模型的假设比较全面,所以萜妹就以这个模型来进行说明。
假设验证
验证中介效应:H1-H3
检验中介效应的常用方法,一般是用SPSS做回归得到各个系数,画出如下三线表。
来源:参考文献[1]
也有直接用Bootstrap法得出中介效应量的。
来源:参考文献[2]
一、回归分析
使用软件:SPSS
①【分析(A)】-【回归(R)】-【线性(L)】;
②将【Y】从左侧拖入右侧因变量中➔将控制变量从拖入自变量中➔点击【下一个】;
③将【X】从拖入自变量中➔点击【下一个】➔将【M】从拖入自变量中➔点击【确定】;
④将【M】从左侧拖入右侧因变量中➔将控制变量从拖入自变量中➔点击【下一个】➔将【X】从拖入自变量中➔点击【确定】。
注:小可爱们要记得,做分析的时候一定要控制其他人口统计学变量,不要无视它们呀;另外就是,萜妹比较懒,所以喜欢用【下一个】的按钮一次性操作完,当然也可以分开单独做回归。
【数据解读】
第③步结果:
第④步结果:
【判断标准】
数据分析部分着重要看萜妹标注的这四个概率。
首先,①最好小于0.05。当①不小于0.05时,自变量对主效应没显著影响,那么研究中介效应就没必要了。
其次,③和④这两个概率需要小于0.05。它们都显著,中介效应量的ab才会有意义。0任何数都是0,所以任何一方不显著,中介效应量都是0。
最后,②这个概率显著与否都可以。
- 如果小于0.05,那么 M 则是部分中介; #NAME?
二、Bootstrap法
上述回归分析是采用依次检验的方法,但是这种方法检验标准比较高,换句话说就是不成立的可能性较大。所以,后续有学者提出了Bootstrap法进行检验。
使用Bootstrap法检验,既可以用SPSS的Process宏程序,也可以使用Mplus语句。
(一)SPSS的Process程序
(注:Process并非SPSS自带程序,需要先安装插件)
①【分析(A)】-【回归(R)】-【PROCESS】;
②左侧 Model Number选择【4】➔Outcome Variable选择【Y】➔Independent Variable选择【X】➔M Variable选择【M】➔ Covariate 选择控制变量➔点击【确定】
【数据解读】
【判断标准】
做出来的结果包括了回归的部分,以及上述截图。
主要得看红框内的数字是否包含0,如果不包含0,就说明中介效应成立。
(二)Mplus
语句:
TITLE: Mediator
DATA: FILE IS 1.dat;
VARIABLE: NAMES ARE id x y m;
Usevariables are x y m;
ANALYSIS: bootstrap = 1000;
MODEL:
m ON x(a);
y ON m(b)
x(c);
MODEL CONSTRAINT:
new (indirect );
indirect = a*b;
OUTPUT:
Standardized Cinterval(Bcbootstrap);
【数据解读】
【判断标准】
图1红框中的概率,最好小于0.05。
图2红框中两个数字,必须同方向,即同正或同负,中介效应才成立。
检验调节效应:H4、H6
检验调节效应一般都是作出交互项进行回归分析,再画出三线表。
来源:参考文献[1]
(注:这个示例中,在model1-3都控制了调节变量,但是只有model3是必须控制调节变量的。)
不过除此之外,它还需要再做简单斜率分析,得到下图与相应斜率。此步骤萜妹通常是使用Excel进行操作。
来源:参考文献[1]
一、回归分析
使用软件:SPSS
前期准备:制作出交互项【int】
(萜妹在《干货丨数据分析之前期准备(下)》中介绍了如何使用Excel计算交互项。如果小可爱们想用SPSS计算的话,也可回顾《干货丨SPSS数据分析之准备篇》)
①【分析(A)】-【回归(R)】-【线性(L)】;
②将【M】从左侧拖入右侧因变量中➔将控制变量从拖入自变量中➔点击【下一个】➔将【X】从拖入自变量中➔点击【下一个】➔将【W】和【int】从拖入自变量中➔点击【确定】;
【数据解读】
【判断标准】
红框内系数需要小于0.05。
二、简单斜率分析
使用软件:Excel
将上图黄框内数据,填入Excel模板中的相应部分。
填入后,图形和右下系数会马上更改。文章撰写时,如实汇报即可。调节效应成立的时候,简单斜率分析不会有问题的。
检验被调节的中介:H5、H7
到了这里通常也是使用Bootstrap进行检验,此时仍然是可以使用Process插件和Mplus语句,进行检验。得到结果后,可以制成表格:
来源:参考文献[3]
也可以用文字进行说明:
来源:参考文献[1]
(一)SPSS的Process程序
①【分析(A)】-【回归(R)】-【PROCESS】;
②左侧 Model Number选择**【7】**➔Outcome Variable选择【Y】➔Independent Variable选择【X】➔M Variable选择【M】➔ Covariate 选择控制变量➔Proposed Moderator W选择【W1/W2】➔点击【Options】,勾选第一项,即中心化➔点击【确定】
(注:标红操作是与简单中介模型不同的部分)
【数据解读】
【判断标准】
得到的结果仍包括了回归的部分,以及上述截图。
黄框内代表着调节变量取值为低值、均值、高值时,对应的中介效应量,是文章中需要报告的部分。
红框内的数字仍是效应量成立的关键,看是否包含0,如果不包含就说明被调节的中介效应成立。
(二)Mplus
语句:
TITLE: first stage moderated mediation
DEFINE:
xw=(x - 3.1163)*(w - 3.2809);! 这里减去的值为均值,需根据自己数据修改。
CENTER x m w (GRANDMEAN);
DATA:FILE IS 1.dat;
VARIABLE:NAMES ARE x w m y;
USEVARIABLES ARE x m w y xw;
ANALYSIS:BOOTSTRAP=2000;
MODEL:
m on x (a1)
w
xw (a3);
y on m (b2)
x w xw;
MODEL CONSTRAINT:
new (ind_h ind_l ind_d);
ind_h=(a1+a3*0.8552)*b2;
ind_l=(a1+a3*(-0.8552))*b2; ! 这里的数值为W的标准差,需自行修改。
ind_d=ind_h-ind_l; ! ind_d为间接效应量。
OUTPUT: cinterval (bcbootstrap);
注:上述标红部分的XW,在萜妹见过的大部分语句中(培训会议示例语句+相关书籍示例语句)都控制了。但是Process的开发者给出的Mplus对应语句中未进行控制(详见《干货丨常用模型的Mplus例句》)。特此提出说明。
模型的结果和解读和普通中介没什么差别,主要需要Bootstrap的置信区间不包含0,故不展开解释。
检验被中介的调节:H9
类型2被中介的调节在process中没有对应的模型,所以只能用Mplus语句计算。最终需要根据结果进行文字描述:
来源:参考文献[4]
语句:
TITLE :Type II mediated moderation;
DEFINE:
xw = (x-3.98)*(w-2.19);
xm = (x-3.98)*(m-3.86); ! 这里减去的值为均值,需根据自己数据修改。
center x w m (grandmean);
DATA: FILE IS 1.dat;
VARIABLE: NAMES ARE x y m w;
USEVARIABLES = x m w y xw xm;
ANALYSIS: BOOTSTRAP = 2000;
MODEL:
m ON w(a2)
x;
y ON xm(b5)
m x w xw;
MODEL CONSTRAINT:
NEW (ind);
ind = a2 * b5; ! ind_d为间接效应量。
OUTPUT:
SAMPSTAT;
CINTERVAL( BCBOOTSTRAP) ;
模型的结果和解读同上,不展开说明。
剩下的假设8就是简单的回归分析,假设10一般都不会涉及,模型语句也比较复杂,这篇推送就先不说它。所以,这篇推送就写到这里啦~
以上就是萜妹想到的,一个尽量与我之前的推送不同,但又有内在逻辑的说明方式。这篇推送写在前面的话,萜妹写了五版,大概尝试搭建了三种推送框架,最后写成这样,其实还是有很多地方可能没提及,但是萜妹真的尽力了。
如果小可爱们在阅读过程中有困惑的地方,可以在往期推送中去查看更详细的说明;如果是对上述操作有问题,也可以留言跟萜妹沟通,视频教程会在所以数据分析结束后再录。
接下来,萜妹会考虑介绍一些稍微复杂的模型。那小可爱们,我们下周见吧~
参考文献:
[1]Owens, B. P., Yam, K. C., Bednar, J. S., Mao, J., & Hart, D. W. (2018, October 8). The Impact of Leader Moral Humility on Follower Moral Self-Efficacy and Behavior. Journal of Applied Psychology. Advance online publication. http://dx.doi.org/10.1037/apl0000353
[2]沈伊默, 诸彦含, 周婉茹,等. 团队差序氛围如何影响团队成员的工作表现?——一个有调节的中介作用模型的构建与检验[J]. 管理世界, 2019(12).104-115+136+215
[3]Chun, J. U. , Lee, D. , & Sosik, J. J. . (2017). Leader negative feedback-seeking and leader effectiveness in leader-subordinate relationships: the paradoxical role of subordinate expertise. Leadership Quarterly,
[4]马君,闫嘉妮.正面反馈的盛名综合症效应:正向激励何以加剧绩效报酬对创造力的抑制?[J].管理世界,2020,36(01):105-121+237.
往期推送
原文链接: