内生变量是自变量吗(内生变量是自变量还是因变量)

建立回归模型的一般步骤如下图

内生变量是自变量吗(内生变量是自变量还是因变量)

1、具体(社会经济)问题

当我们想去解决一些现实生活、经济问题时,需要将具体问题量化成数据,然后通过观察与揭示事物(数据)之间的内在联系得出规律,从而达到解决现实经济问题(及时止损、预测),奔着这个目标产生了一些列的可行性问题。

2、设置指标变量(量化具体问题)

可行性问题已经产生,接下来就要根据问题研究的目的设置因变量 y ,然后选取一些和因变量y有统计关系的自变量 x1、x2...

这里一定要明确一点:什么是因变量 y 和自变量 x,其实通俗来理解就是下图中的因果关系

内生变量是自变量吗(内生变量是自变量还是因变量)

我们需要通过经济变量(要研究的) '果' 选出一些影响它且合理的变量 '因',在回归模型中对于这两类变量有一些术语需要了解

因变量(果)也被称为被解释变量、内生变量;

自变量(因)也被称为解释变量、外生变量;

注意01:在变量选择这一块,研究不同的问题领域跨度大、专业性强,对于完全不了解的领域需要和这方面的专家、或者有经验的人士询问合作。这样可以更好的帮助我们确定研究问题的模型变量,做到不耻下问 。

注意02:回归模型的解释变量选取个数上并不是越多越好,若选取的变量之间有较大的信息重叠,就会出现共线性问题,并且变量多导致的计算量大,误差也大,进而导致最终模型参数精度也不高。

一般在选取指标变量时往往不能一次完全正确,需要反复调整找到最合适的指标变量。

3、收集、整理数据

指标确定之后,接下来就是搜集需要的指标数据了。要搜集样本数据可分为时间序列数据和横截面数据。

时间序列数据:

时间序列数据就是按照时间顺序排列数据,如下图,各指标数据跟着时间在变化:

内生变量是自变量吗(内生变量是自变量还是因变量)

横截面数据:

横截面数据即在同一时间截面上统计的数据集,如2018年我国各省市GDP数据

内生变量是自变量吗(内生变量是自变量还是因变量)

注意点:时间序列数据容易产生随机误差项的序列相关(处理方法:差分法)

4、回归模型的确定

上一步骤中,数据已经准备好,接下来就要从这些数据中提炼出一套宇宙公式--回归模型(数学形式)。首先第一步我们需要在笛卡尔坐标系中画出这些样本点的散点图,

内生变量是自变量吗(内生变量是自变量还是因变量)

为什么要先画散点图呢?我们知道回归模型的种类有多种,如线性回归、非线性回归...。画出散点图,我们可以根据散点图的分布形式大致确定该建立哪一种回归模型才是较合适的。

如果根据散点图实在无法确定模型的形式时,则可以将有争议的模型分别进模拟,然后从模拟结果中选出模拟效果最好的一个作为最终的理论回归模型。

内生变量是自变量吗(内生变量是自变量还是因变量)

5、模型参数估计

当回归模型的的具体分类选取确定后,接下来就要对模型中的未知参数进行估计,常见的也是最最经典的参数估计方法为:最小二乘法。

在最小二乘法的基础上又衍生出了偏最小二乘法、主成分回归、岭回归等,他们都是为了解决不满足模型基本假设而衍生出来的新方法。

6、模型检验与修改

初步的回归模型建立好后,还不能直接用于实际应用,模型是否正确解释问题指标之间的因果关系还是个未知数,此时需要去检验模型的可行性。

通常对模拟有效性的检验有两种方法:

1 统计性检验

内生变量是自变量吗(内生变量是自变量还是因变量)

2 具体问题(经济)意义检验

模型侧面揭示了具体的社会经济问题,例如我国GDP增长量与银行贷款发放量、耗电量等之间的关系从经济理论是上看是正相关关系,但是模型中的回归系数若为负数,则这个模型也是没有意义的。造成这种现象的原因可能有:自变量之间存在多重共线性、数据质量问题等。

模型需要通过统计检验和经济意义检验共同检验通过后才是有效可行的。

7、回归模型的应用

经过以上的种种九九八十一难,终于可以将该模型用于实际生活、经济问题上了。

我们可以从模型的回归系数上发现所研究的变量之间的结构关系,从而给出量化后的评价与建议。

调控:确定好的回归模型反馈了经济变量之间的因果关系后,根据已知结果的情况下调整具体的经济指标数据等。

例如:为了降低通货膨胀指标为5%以下,可以根据回归模型确定货币发行量、银行的存款利率等。

预测:可以根据回归模型预测我国2022年的国民收入等。

以上几个步骤就是一个回归模型建立到使用的全部流程,模型的修改往往要反复修正后才能得到一个理想模型。这个反反复复修改模型的过程可以从写论文中感触到。

--- END ---

更多精彩内容请关注 公众号:数据与编程之美

原文地址:建立回归模型的完整步骤

本文内容源自网友投稿,多成号仅提供信息存储服务不拥有所有权。如有侵权,请联系站长删除。qq97伍4伍0叁11