回归特征选取_Meta回归分析的原理与应用

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-30 16:37   11   0

最近有两篇论文,分别是发表于2018年的A History of Meta-regression:Technical, Conceptual, and Practical Developments Between 1974 – 2018和发表于2019年的Current Practices in Meta‐Regression in Psychology, Education, and Medicine,引起了我对meta回归分析的兴趣。奈何我功力浅薄,不能研读这两篇长文,只好先查一下中文资料,搞清楚什么是meta回归分析。

Meta回归分析的原理

Meta回归分析可评价研究间异质性的大小及来源。假如一项元分析纳入了20项研究,其中一些研究发现体育锻炼能改善抑郁症状,一些发现体育锻炼对抑郁情绪没有影响,还有一些研究发现体育锻炼会恶化抑郁。这些研究之间就存在异质性,研究结果的不一致可能是因为研究方案、研究的时间和地区、研究质量、体育锻炼的方式、被试的年龄和性别、抑郁的程度等。为了探究异质性的来源,需要进行Meta回归分析。

Meta回归分析采用回归分析的方法,探讨某些实验特征或病例特征等协变量对Meta分析中合并效应的影响,以明确各研究间异质性的来源。

纳入Meta回归分析中的协变量是研究或试验水平的一些特征,如研究设计、干预量、给药途径、疗程、患者的性别、年龄、种族、研究样本量;也可以是单个研究内所包含病例的综合特征,如患者的平均年龄、平均身高等。但是不能将单个患者的身高、体重等指标作为Meta回归分析的协变量。

Meta回归也需要考虑各自变量间的交互作用和共线性等问题,以免各Meta回归模型选出的异质性影响因素极不一致,系数也不稳定。

根据统计模型的不同,可将Meta回归分析分为固定效应的Meta回归分析和随机效应的Meta回归分析两大类。 基于固定效应模型的Meta回归分析假设多项研究具有一个共同的效应尺度,各项研究效应尺度存在的差异主要是因为随机误差造成;随机效应模型则假设各项研究不具有共同的效应尺度,而是每项研究都有自己的效应尺度,并将其定义为一随机变量,该变量呈正态分布。固定效应模型要求资料满足正态性、观察值间的独立性和研究间的方差齐性,如对不满足这三个条件的资料进行固定效应的分析, 就有扩大犯I类错误概率的风险;随机效应模型则只要求资料满足正态性,其它两个条件则不作要求,故扩大了适用范围。在随机效应模型中,有最大似然法、矩法、限制性最大似然法、贝叶斯法等多种用于估计回归方程中的系数和研究间的变异。

Meta回归分析的步骤

以发表于2018年的论文《收入分配与居民健康——基于Meta回归分析》为例,研究者运用Meta回归分析方法,从数据类型、样本特征、指标选取、理论框架、估计方法、控制变量、研究区域、时间跨度等方面检验了不同的研究特征对收入不平等与居民健康关系的实证结果的影响。

Meta回归分析的一般步骤如下:首先搜集整理关于某研究主题的发表或者未发表的实证文献,其次在所搜集的文献中提取一系列信息,包括作为因变量的统计量,如参数估计量、显著性、t统计量等,以及作为自变量的研究特征,包括样本选择、指标设计、模型设计等代理变量,最后建立相应模型检验各自变量对研究者感兴趣的因变量的影响。Meta回归基本模型为如下。

fc7ca8a7427066da3be792c73202b0af.png

式中,Yi 为选取的因变量,Xki为第 k 个自变量的第 i 个值,βk 为相应系数,n 为 Meta 回归分析的样本量,εi 为随机扰动项。通常的回归模型采用最小二乘线性(OLS)估计,效应量的选择可以是回归系数、t 统计量、显著性或偏相关系数,由于不同研究所用模型不同,所以如今采用回归系数较少,而 t 统计量和显著性最为常用。

在因变量的选择上,这项研究采用收入不平等对健康影响的显著性、正向显著性、负向显著性以及倒U型显著性,分别运用有序 Logit 和二元 Logit 方法进行估计。虽然采用显著性作为因变量没有 t 统计值精确,但却有保证一些实证研究未报告 t 统计值的样本不受损失的优点。

在自变量的选择上,这项研究选取了不同研究特征的代理变量,包括样本量,样本是否仅为农村样本,理论框架、健康指标、收入不平等指标,估计方法、研究区域范围、模型控制变量、是否采用固定效应模型、时间跨度等。考虑到从同一篇文献中提取多组数据可能发生的估计误差,这项研究将每一篇文献运用模型数量的倒数作为权重加入模型估计中。

总之,Meta回归分析主要从效应量选择、自变量选择和估计方法三个方面入手。

气泡图

气泡图可用于展示三个变量之间的关系。它与散点图类似,绘制时将一个变量放在横轴,另一个变量放在纵轴,而第三个变量则用气泡的大小来表示。

Meta回归得到的影响因素作用大小可以利用气泡图上显示,横坐标是研究水平上的影响因素,纵坐标效应量(可能需要转换,如取对数),每个圆圈代表一个研究,圆圈越大说明该研究的效应量方差越小,精确度越高,权重越大。如果回归线斜率不为0,说明影响因素对研究间效应有作用。

Meta回归分析的应用

Meta回归分析在教育学、心理学、医学、经济学等多个领域均有应用,可参见《多水平Meta回归分析及其在流行病学研究中的应用》《经济学中的META回归分析》《Meta回归与亚组分析在异质性处理中的应用》以及前面提到的两篇英文论文。

Meta回归分析对筛选异质性影响因素比较可靠,据此进行的亚组分析能明显降低亚组内的异质性。因Meta回归与亚组分析操作简单,结果易于解释,应用方便,故在存在统计学异质性又要计算合并效应时结合使用,可正确识别并降低异质性,从而使Meta分析结果更为稳健与合理。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP