计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）

今天给各位分享计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）的知识，其中也会对计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文导读目录：

1、计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）

2、计量经济学模型

3、计量经济学(1) 因果模型

　　绪论中已经介绍到，模型按线性关系可划分为线性模型和非线性模型，其中线性模型又分为解释变量线性和参数线性两种。例如描述税收与税率的拉弗曲线：其中表示税收，表示税率，作变换原方程化为　　例如Cobb-Dauglas生产函数: 为产出，为资本，为劳动，取对数后得到　　例如常替代弹性CES生产函数: 为产出，为资本，为劳动，为替代参数，为分配参数. 　　两边取对数得到　　将在处泰勒展开，只保留前三项，得到　　双对数模型：，度量了对的弹性，即当变动百分之一，变动的百分比为。　　如果是多元　　那么系数代表偏弹性。　　线性-对数模型：　　求微分得到　　当变动百分之一时，的绝对变动为 .（注意有0.01！）例对于回归含义：每增加一个百分点，平均增加单位　　对数-线性模型：　　两边微分得到　　当变动一个单位时，的变化率为 .例对于回归含义：每增加一个单位，的平均变化率为，即平均增长率为　　疑难点：什么时候乘0.01，什么时候乘100？　　下图是我的理解：例1 产品平均成本与产量的关系，为平均可变成本，为总不变成本。　　例2（恩格尔曲线）某商品的消费支出与总收入的关系，为收入的临界值，该临界值下不会购买商品；为消费的满足水平，在此水平上不会有消费。　　例3 （菲利普斯曲线）工资变化率与失业率的关系，趋于直线　　适用：存在自然极限。例估计成本函数　　问：解释变量相关，是否违背无完全共线性的基本假定？　　答：解释变量是非线性相关，没有违背基本假定。　　考察中国工业生产函数模型，在规模报酬不变的条件下，，那么模型转化为，两边取对数得到双对数模型　　利用数据计算回归系数得到　　这等价于　　如果没有规模报酬不变，直接两边取对数得到　　利用数据计算回归系数得到　　施加约束与未施加约束的回归结果很接近，能否认为约束为真？之后会进行检验。　　问题：有些因素无法定量度量。如性别对收入的影响，自然灾害对GDP的影响。　　解决方案：引入虚拟变量，将这些因素“量化”。　　例如　　反映文化程度的虚拟变量可以取为　　反映性别的虚拟变量可以取为　　虚拟变量的作用：将定性因素“量化”。把不同属性的样本合并，扩大了样本容量，提高模型精度。比如研究性别，原来是男女分别做然后比较，做两个回归，现在是引入虚拟变量，只需做一个回归，并且样本容量变大了。分离异常因素的影响。比如疫情今年影响很大，可以通过虚拟变量将其分离出来。　　例下面是以性别为虚拟变量的企业职工薪资模型，研究不同性别之间收入是否有差异　　其中表示薪资（千元），表示工龄，。回归结果如下　　回归结果表明：工龄相同，男性比女性的平均年薪资高了1330元，并且这一差异是显著的。　　※原则一：避免“虚拟变量陷阱”：　　当一个定性因素有种属性时，只能引入个虚拟变量，否则会陷入“虚拟变量陷阱”，导致完全共线性。（如果没有截距项，则引入个）. 　　例对于季节因素对冷饮销售影响，有春夏秋冬四个属性，这里只设置三个虚拟变量：　　则冷饮销售量模型为　　如果引入第四个虚拟变量，则模型变为　　这一模型的矩阵表示形式为　　对于其中一种观测值矩阵（事实上对于任何观测值都一样，这里以一个特例说明）　　第一列可以表示成后4列的线性组合，因此观测值矩阵不是列满秩，从而参数无法唯一求出。　　问：能否设置反映季节因素的变量为？（注意这不是虚拟变量！）　　答：不好。　　对应模型为，将的不同取值代入得到　　如果用三个虚拟变量，将不同虚拟变量取值代入得到　　上面式子中，春夏秋冬之间的差别固定为，下面式子，春夏秋冬的差别由三个系数所决定，没有固定，因此更合理一些。　　例某模型包含季节（4状态），性别（2状态），职业（5状态），需要设置多少虚拟变量？　　解包含常数项：3+1+4=8；不包含常数项：8+1=9. 　　原则二：虚拟变量取“0”代表比较的基准. 　　例如引入政策变动对经济的影响　　只是一般准则，交换也可以. 　　原则三：虚拟变量可作为解释变量也可作为被解释变量. 　　如果作为被解释变量，那么取值只有0和1，不是正态分布了。这一模型不是经典计量经济学模型，而是现代计量经济学模型。　　例之前那个以性别为虚拟变量的企业职工薪资模型就是加法引入　　其中表示薪资（千元），表示工龄，。　　男女职工的平均年薪为　　虚拟变量的系数体现在截距上，称为截距差异系数。　　加法是考虑截距不同，但有时候虚拟变量会引起斜率变化。　　例如研究城镇和农村居民的消费倾向，设虚拟变量为　　对于农村居民：　　对于城镇居民：　　虚拟变量的系数体现在斜率上，称为斜率差异系数。　　用两个样本分别做一元回归得到　　（1），两回归相同，为重合回归　　（2），两回归差异仅在截距，为平行回归　　（3），两回归差异仅在斜率，为汇合回归　　（4），两回归完全不同，为相异回归　　例对于农村和城镇居民收入和消费的回归　　为消费，为工资收入，为其他收入。　　农村居民　　城镇居民　　引入虚拟变量，同时用加法和乘法引入　　其中右端第二项是加法引入，第四和第六项是乘法引入。　　利用数据得到的回归结果为　　在0.1的显著性水平下，和显著，不显著。　　结果分析：农村居民的平均消费支出要比城镇居民少1573.9元在其他条件不变的情况下，农村居民与城镇居民的工资收入都增加1元时，农村居民要比城镇居民多支出0.19元用于生活消费;农村居民与城镇居民在其他收入方面有相同的增加量时，两者增加的消费支出没有显著差异。　　有时根据经济理论会对回归模型中的参数施加一些约束：消费需求函数的0阶齐次性生产函数的1阶齐次性（规模报酬不变）　　例考察模型　　施加约束得到　　变量替换后改写为　　由此做回归得到，再由约束条件有 . 　　问题：能否施加约束？解决：主要是F检验法。　　基本思想：如果施加约束前后，解释效果一样，那么约束为真。　　思想的实现：回归平方和能够度量解释效果，又注意到无约束与受约束两者离差平方和一样，所以解释效果可以由残差平方和度量，如果受约束残差平方和显著增大，那么认为约束为假。　　无约束的样本回归模型：　　受约束的样本回归模型：　　两者残差的关系：　　残差平方和的关系：　　其中利用，得到有两项为0，并且注意到第二项非负，所以　　受约束的残差平方和不小于无约束残差平方和：　　由于两者总离差平方和相同，所以受约束的回归平方和更小，解释能力也更低。　　构造的F统计量为　　其中分别为无约束和受约束模型中解释变量的个数。注意因为残差平方和的自由度为，所以分子上除的是　　F统计量度量的是两者残差平方和的差异，当F统计量的值比较大的时候，认为约束为假。查表得到临界值为，拒绝域为 . 　　例之前生产函数施加规模报酬不变约束　　无约束回归为　　受约束回归为　　计算两者残差平方和　　计算检验统计量的值为　　查表得临界值，所以不能拒绝规模报酬不变的假设. 　　运用受约束回归的思想可以推出方程显著性检验的F统计量，对应于方程显著性检验的约束为　　最后一个式子就是方程显著性检验的F统计量，第三个等号利用　　考察下面两个模型　　那么上面可以看做下面的受约束回归，约束为　　相应的F统计量为　　如果F统计量大于临界值，则说明额外的变量应该包含在模型中，反之则不应该包含在模型中。上面的式子分子分母同除TSS，得到　　这说明可以通过变量增减前后的拟合优度变化，来判断是否应该增加或减少解释变量个数。但前提是受约束与无约束的TSS是相同的。　　问题：使用两组样本分别做回归，得到的回归系数有无差异？　　思想：受约束回归，找到约束条件。　　矩阵表示为　　如果两组样本的回归系数没有差异，那么，进而　　检验统计量为　　可以证明，所以检验统计量可以写为　　此外，也可以引入虚拟变量将样本合并，并且虚拟变量法能够更细致的知道两样本的差异是在斜率上还是在截距上。　　证明：　　先推导残差平方和与模型中矩阵的关系　　无约束模型为　　利用已经推导出来的关系式进一步计算得到　　考虑由两个或两个以上经济关系共同确定的数据的计量经济学模型-这些联立方程模型与以前研究的不同，因为每个模型中有两个或更多的因变量，而不是只有一个　　-联立方程模型也不同于迄今为止所考虑的大多数计量经济模型，因为它们由一组方程组成。　　需求：　　供给：　　问题是：内生回归因子与随机误差和相关，这对我们通常的最小二乘估计过程有很大的影响，使最小二乘估计有偏和不一致。　　需求和供给方程可以将内生变量和表示为外生变量的函数。　　这种模型的重新表述称为结构方程系统的简化形式reduced form 。　　为了求解，使需求和供给方程中的等于: 　　求解：　　求解：　　参数和称为简约形参数reduced form parameters。误差项和称为简化形式误差. 　　简化后的方程可以用最小二乘法一致地估计, 解释变量在该系统之外确定。它与扰动和无关，它们本身具有零均值，常方差，零协方差的一般性质。因此，最小二乘估计器是BLUE估计和。　　简化方程在经济分析中具有重要意义。这些方程将内生变量的均衡值与外生变量联系起来。　　识别问题：　　The Order condition of identification 　　Let m = number of endogenous(or jointly dependent) variables 　　Let k = total number of variables (endogenous or exogenous) excluded from the equation under 　　consideration 　　If , the equation is exactly identified 　　If , the equation is over identified 　　If , the equation is under identified 　　A Test of Simultaneity:Hausman Specification TestStep 1 Estimate the reduced form equationStep 2 Regressonandand perform a t test on the coefficient of. If it is significant do not reject the hypothesis of simultaneity, otherwise reject it. 　　工具变量的有效性：　　相关条件意味着工具必须解释内生回归变量的一些变化: 　　如果满足以下条件中的至少一项，则这些工具是相关的非零　　如果要么为零，要么几乎为零,则称这些工具较弱；　　Rule of thumb: F-stat is at least 10 ) strong instruments 　　当回归方程中只有一个内生解释变量和多个外生变量时，回归方程为　　在第一阶段中，用与所有的外生变量——外生解释变量和工具变量进行回归。　　在 TSLS 的第二阶段，先用上述式估计的来替代原式中的，然后进行 OLS 估计。由此，得到的就是 TSLS 的估计量。　　在进行第一阶段回归时，除了工具变量外，所有的外生变量（或控制变量）都需要包含在其中。而第二阶段回归也需要包含这些外生变量。　　当有多个内生解释变量时，第一阶段的工具变量回归是每个内生解释变量分别与它对应的工具变量进行回归，然后再将所有的估计值放入第二阶段回归中得到 TSLS 估计量。　　检验弱工具变量的经验规则：当只有一个内生解释变量时，检验弱工具变量的方法就是计算 TSLS 第一阶段的 F 统计量。第一阶段 F 统计量为包含在工具变量中的信息提供了一个不错的测量指标：包含的信息越多，F 统计量越大。经验规则是；如果第一阶段 F 统计量大于 10，不存在弱工具变量；如果小于 10，可能就是弱工具变量。　　对于弱工具变量：　　（1）去寻找其他的更强的工具变量。　　（2）仍然使用弱工具变量，但是估计方法不用 TSLS，而用其他估计方法，例如有限信息极大似然（LIML）估计量。　　如果有一个内生解释变量，多个工具变量，那么，可以计算出多个 TSLS 估计量（每个工具变量计算一个）。假设有两个工具变量，那么，计算的两个 TSLS 估计量不同。但是如果两个工具变量都是外生的，那么，它们会十分接近。如果估计的两个 TSLS 估计量差异非常大：要么其中一个工具变量不是外生的，要么两个都不是外生的。在过度识别情形下，过度识别限制检验（J 统计量）就是在对多个工具变量 TSLS估计量进行比较。　　J 统计的原假设是工具变量是外生的。　　J 统计量拒绝原假设味着估计是基于无效的 IV 估计，因为 IV 外生性条件不满足。　　常见的寻找工具变量一般思路如下[1]：气候、地理等自然因素：降雨等气象因素、地势等地理条件是高度随机的，但也会影响某些经济社会过程，从而能够满足外生性和相关性；历史因素：过去的历史事件一般与当今的社会经济结果无关；生理现象：生育双胞胎等现象具有较强的随机性。使用更高层级的变量作为低层级变量的工具变量：比如，研究个体金融知识与创业选择时，创业概率与金融知识存在反向因果关系，因而金融知识是内生变量。为了克服内生性，作者选用同一个社区其它居民的金融知识平均水平作为个体金融知识的工具变量。但从这一角度寻找工具变量，往往不能完全保证外生性；内生变量的滞后项。　　假设地区的2个时期的观测值( ,按照以下面板数据回归模型: 　　:随着时间的推移而保持不变的未观察到的特征(例如，位置)。很多城市的特定变量不会随时间改变太多　　:误差项　　将第一个方程从第二个方程中减去，得到: 　　首先，一阶差分消除了，如果时，遗漏变量误差问题得以解决。　　一阶差分估计量是所谓固定效应估计量的一种特殊情况(T = 2)，利用一阶差分模型，我们只能估计时变变量的影响。　　标准的面板数据模型是：　　两个常见的面板数据估计: 　　固定效应: 与一个或多个相关；　　随机效应: 独立于所有 (不太重要的情况，因为只有当OLS无偏时它才会无偏)FE.1：线性参数FE.2：从横断面上随机抽取了一个样本FE.3: 每个解释变量对于随时间变化(至少对于某些 )，解释变量之间没有完美的线性关系。FE.4. 所有时间段的零条件均值: (有时称为严格外生性) 　　该估计量在FE.1-FE下是无偏的(且一致的), 因为。　　简单的面板数据模型是：　　步骤1: 对于每个，取一段时间内的平均值：　　步骤2: 从原始面板数据模型中减去平均模型: 　　ˆ 是用以上回归方程的OLS估计得到的称为" within "因为它使用在内的变化-在内的变化，随时间变化。在FE.1-FE.4下，有时称为“固定效应".估计量无偏(且一致), 因为, . 　　我们也可以直接控制，通过OLS估计: 　　其中是虚拟变量，当时等于1(否则为0), 与内估计量给出的的估计完全相同; 　　由于有k + N个参数需要估计，虚拟变量回归在计算上是不可行的和/或不方便的。FE.1：线性参数FE.2：从横断面上随机抽取了一个样本FE.3: 每个解释变量对于随时间变化(至少对于某些 )，解释变量之间没有完美的线性关系。FE.4. 所有时间段的零条件均值: (有时称为严格外生性)FE.5 Homoscedasticity: for all FE.6 No serial correlation: , for all . 　　Under FE.1-FE.6 the within estimator is BLUE. 　　如果我们也这样假设, 来自正态分布, 很大(但不一定是 ), 那么我们就可以使用通常的和统计量。 , doesn't matter they are identical , 　　Key difference: 　　only uses information from 2 periods ( and ) 　　uses information from all periods of data. 　　Efficiency: 　　Under FE.1-FE.6: FD less efficient than WE 　　serially correlated: FD can be more or less efficient than WE Bias: 　　So WE imposes more stringent conditions for unbiasedness, and is thus more likely likely to be biased. 　　基本形式：　　在线性概率模型中，表示其他自变量不变的情况下，自变量单位变化引起的概率变化。　　Stata操作：　　reg y x1 x2 x3 　　LPM模型的不足之处：LPM假设的概率随解释变量线性变化，无论此值的大小是。　　2. 概率必须在0到1之间。但是，没有确保来自LPM的概率值将在这些范围内限制。　　3. 通常假定误差项为正态分布，因为它遵循二项式分布，因变量介于零和一之间，不能保证服从正态分布。　　4. 由于y的二元性质，线性概率模型违反了同方差假设。　　基本形式：　　在离散选择模型中，都显示了随着变量单位变化，发生和不发生概率比值的对数变化。　　Stata操作：　　logit y x1 x2 x3 　　margins, dydx(*) atmeans ##The marginal effects 　　基本形式：　　Stata操作：　　probit y x1 x2 x3 　　margins, dydx(*) atmeans ##The marginal effects 　　Probit和logit通常得出相似的结果。　　两种模型之间的主要区别是逻辑分布是厚尾。　　实际上，没有明显的理由选择一个或者放弃另一个。　　许多研究人员选择Logit是因为它比较简单。　　LPM模型与非线性模型的最大区别在于，LPM模型假设边际效应为常数，而logit模型和probit模型则在改变x值时暗示了局部效应的大小的变化。　　Log odds: 　　Partial Effect of 　　回归结果如下图：解释变量居家（上学是对照组）工作（上学是对照组）教育-0.346(0.070)-0.146(0.170)经验-0.122(0.124)-0.522(0.524)经验^2-0.011(0.032)-0.211(0.132)性别-0.673(0.324)-0.473(0.224)常数项-0.673(0.324)-0.773(0.624)Log-likelihood-876.43Pseudo R20.542 　　回归系数解释：　　教育：再接受一年的教育，在家和上学的log odds 概率就会降低0.674; 　　Multinomial Logit Model 弊端：他们做了一个隐含的假设，即任意两个选项的相对概率只取决于这两个选项的属性: 　　这意味着第三种选择的存在并不影响j和k之间的log odds。这被称为不相关选择的独立性(IIA)。这在现实中是难以实现的。　　给定是标准正态分布：　　Partial Effect of 　　举个例子来说明order probit model. 　　假设有N个人住在一个地区，且每个人的“社会剥夺程度”可以用变量的取值来表示，且变量越高，表示越高的剥夺程度。对于某个特定个人赋予的“剥夺指数”假设值，取决于这个人既有的多种因素。这些因素可能包括失业、单亲家庭及居住于某一特定区域。假设剥夺指数是个因素的一个线性函数，这个因素的取值对于个人来说，为， . 这意味着剥夺指数可以表示为：　　用的取值所表示的真实的个人剥夺状态的精确表达是难以观察到的，剥夺指数是一个潜在变量，但在原则上和实践上都难以察觉，但是可以定义一个人被剥削的程度，例如一个人可以被归类为“没有被剥削“、”轻度被剥削“或”严重被剥削“，定义如下：　　如果此人没有被剥削；此时对应一个参数临界值　　如果此人轻度被剥削；此时对应一个参数临界值　　如果此人严重被剥削；此时对应一个参数临界值　　此时对应的估计概率值为：　　对于正太分布的标准变量可以表示为：　　对于边际效应：　　一般性来说：　　用似然比检验上述各变量的联合显著性。　　举个例子来说：　　从以上结果可以得到两个临界值分别为：　　-2.945600 　　-2.089993 　　计算分数对成绩为6的学生上两年制大学的概率的边际影响。　　计算一名来自四口之家的黑人学生(父母中有一位上过大学，家庭收入为52,000美元)，如果成绩等于6.64，将上四年制大学的概率。　　Partial Effect of 　　The average partial effect (APE) 　　解释变量Linear （OLS）Poisson （QMLE）educ-0.0644(0.0063)-0.0217(0.0025)age0.272(0.017)0.337(0.009)age^2-0.0019(0.0003)-0.0041(0.0001)female-0.228(0.046)0.315(0.021)constant-3.394(0.245)-5.375(0.141)Log-likelihood-6,497.060R^20.5900.598 　　结果解释：　　多受一年教育的儿童数量将减少0.064。这意味着，如果我们将100名女性的受教育年限增加1年，我们预计会少生6个孩子。　　为了使解释具有可比性，考虑Poisson模型中educ的APE: 2.268*(0.0217)= 0.0492。这比线性模型的数值要小一些。　　这种情况是指右删失，因为在某个水平以上未观察到因变量。有一个已知的上限阈值。这也称为从上方审查. 　　这种情况是指左删失，因为在某个水平以下未观察到因变量。有一个已知的下限阈值。这也称为从下方审查. 　　Stata 回归代码：　　cnreg y x1 x2 x3 x4, censored(cens) 　　Truncated data models-Truncated regression models 　　Stata 代码：　　truncreg y x1 x2 x3 x4 if y>0, ll (0) 　　在删失回归中，因变量被删失低于或高于阈值，但观察到解释变量。　　在截断回归中，部分总体被完全排除。　　Where the function is called the inverse Mills ratio. 　　Partial Effect of 　　可以使用样本均值进行估计，或者使用解释变量Linear （OLS）Tobit（MLE）educ-3.45(2.54)-8.81(4.46)age28.76(12.95)80.65(21.58)age^265.67(9.96)131.56(17.28)female-32.78(23.18)-1.86(0.54)constant1,330.48(270.78)965.31(446.44)Log-likelihood-6,497.060R^20.2660.274σ750.181,122.02 　　结果解释　　Tobit 模型主要依赖于模型假设，尤其是错误的正态性和同方差性　　如果违反了这些假设，则很难说 Tobit MLE 正在估计什么。如果与假设的偏差很小，Tobit 模型可能仍会给出部分效应的适当估计。　　Tobit 模型适用于堆积为零但也占据广泛正值的非负结果。　　(1) 外生变量设一组随机变量且在上相互独立. 称为外生变量(exogenous variables)的集合. (2) 内生变量称研究所聚焦的有限个随机变量为内生变量(endogenous variables), 且 .(3) 内生变量取值函数为每个内生变量定义一个取值函数 , 使 . 其中: i) : 即由其它内生变量组成, 为 endogenous direct cause的缩写; ii) 且 : 称为专属的外生变量. (4) 结构因果模型记函数族 , 定义为一个结构因果模型(structural causal model, SCM). 讨论结构因果模型按上述方式定义的原因: (1) 仅对内生变量间的因果联系建模, 忽略外生变量的原因. 因此, 对每个内生变量定义取值函数 , 其取值由两部分因素决定: 其他内外生变量和 . 这正是‘内生性’的体现.(2) 当恒为定值, 一旦取值确定, 内生变量的取值也会被固定. 因此引入是为了对额外随机因素建模, 以模拟样本抽样时的噪音或表示个体在总体中的分布. 此外, 要求引入专属的外生变量独立于其他所有外生变量, 则外生变量间的相互独立性保证了中显性包含所有内生变量共因 (外生变量独立的模型称为Markov Model, 不独立的称为Semi-Markov Model).将的所有自变量代入得到 , 再将的所有自变量代入得到 , 以此类推层层嵌套, 得到 . 由于内生变量的个数有限, 所有内生变量都最终被外生变量表达, 即 .该分析表明: 当锁定一个样本/个体 , 该个体的所有外生变量为常数(也可假设也是随机变量, 无非额外添加一层随机性). 则该个体所有内生变量都会被确定. 因此, 模型中所有变量的随机性本质上均源自 , 即个体在外生变量上的差异构成了总体分布. 总结: 内生变量及其取值函数确定了结构因果模型的机械躯干，而所有专属外生变量的变化为模型注入了随机变化的动力.设结构模型 . 构造一个贝叶斯网络 . (1) 的内生变量的DAG的结点 ; (2) , 中的自变量的DAG的 ; (3) 的的 . 此外, 以为条件, 仅为的函数, 或者说的随机性诱导了条件分布 : 对于的任意非后代结 , 由2.3中所述, 为除以外其它外生变量的函数. 否则假设也为的函数, 因仅为的自变量, 则也为的函数, 则也为的函数, 以此类推得 , 矛盾! 因此与其非后代结独立, 即在 DAG 上满足Local Markov, 由上节内容知, 为贝叶斯网络.因此, 称为对应的贝叶斯网络. 每个结构因果模型都对应一个图形表示型 , 但反之不然, 可通过调节不同的使其对应同一个贝叶斯网络 .在建立了结构因果模型后, 可将相关变量间的关系进行定义. 设结构模型 . 记相应的贝叶斯网络为 . 设为一个内生变量. (1) 内生直接原因称为的内生直接原因, 图形上即的父结中有父结的变量; (2) 外生直接原因称为的外生直接原因, 图形上即中的父结中无父结的变量; (3) 直接原因称 , 即的所有自变量为的直接原因, 图形上即的所有父结. 设 , 且存在以为起点的序列 , 使得 : (1) 可能原因、可能因果联系称为的可能原因(possible cause). 2.3层层嵌套得到的表达式过程中, 所有中间步骤的自变量都是的可能原因. 因此, 的可能原因仅有两种: 要么是直接原因, 要么是的某可能原因的直接原因. 图形上即 , 显然, 的所有可能原因正是祖先结点 .称为到的一条可能因果联系(possible causal association), 图形上即序列为到的单向路线. (2) 原因注意到罕见情况: 即虽为的可能原因, 但仍有 . 见下例: . ; , , ;,. 显然 , 因此为的可能原因. 但的取值仅影响时的取值, 而仅当时的取值才会影响 , 即 .因此, 定义为的原因(cause)为: 为的可能原因且 , 记作 . 图形上即 , 且 . 注意: 在大多数结构因果模型中, 假设可能原因即为原因, 该假设称为Minimality.对 , 若路线在中为通路(即路线流出且未遇到对撞), 则称通路为到的一条联系(association).由上一节推论, 若到不存在任何一条联系, 即两点被空集D-分离, 则两点一定相互独立/不相关; 反之, 若到存在一条联系, 即两点不被空集D-分离, 则两点可能相关. 在大多数结构因果模型中, 一般假设存在联系的两点相关.显然, 若为到的一条可能因果联系, 即 , 则 , 即也为到的一条联系. 但反之不一定. 因此我们说, 相关性(联系)不一定意味着因果联系.考察两个结点间的所有联系(通路).(1) 可能因果联系的判别: 若到的某条联系从流出, 此时该联系必为单向路线(所有箭头的方向远离 , 否则会出现对撞, 阻断通路), 则为的可能因果联系. 因此, 到的联系中所有经过流出箭头的到的所有可能因果联系.(2) 非因果联系/后门联系/共因联系定义及判别: 在到的所有联系中,非因果联系称为后门联系(backdoor association). 由上述可能因果联系的判别, 到的联系中所有流入的均是后门联系.此时该联系对应的通路上有且仅有一个分叉: 没有分叉的通路为单向路线(存在对撞则不通), 即为可能因果联系(只不过方向相反, 为的可能原因); 若有两个及以上的分叉, 则路线自身必有对撞阻挡而不构成通路. 所以又称后门联系为共因联系(confounding association), 唯一的分叉的中间点称为共因(confounder).总之, 在图形因果模型中, 两个结点之间有三种状态: (1) 无联系(无路线相连或所有相连路线均非通路)； (2) 有联系, 但存在后门/共因联系； (3) 有联系, 且所有联系均为可能因果联系.此时, 我们明确发现, 相关性可能会掺杂着后门联系, 因此不能将相关性的推断替代因果推断! 　　图形表示与结构因果模型的优劣结构因果模型是可参数化的(parametric): 更准确得到变量取值的定量决定式, 为后续因果关系的估计提供精细结构, 可以唯一确定一个因果模型; 图形因果模型是非参数化的(non-parametric): 更易看到变量间联系、可能因果联系, 更具一般性, 但对应了一族结构因果模型, 只能描述变量间大体框架.

计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）、计量经济学第五讲（多元线性回归模型：非线性模型、虚拟变量模型、受约束回归）的信息别忘了在本站进行查找喔。

未经允许不得转载！ 作者:谁是谁的谁，转载或复制请以超链接形式并注明出处。

原文地址：http://www.1688h.cn/post/22165.html发布于：2026-03-22