凤凰送彩金

兰德资本(北京)回归时,为什么要对交叉项目进行平均?

写这篇文章的原因是微信群中的一场争论。

我想很多人都知道,当我们进行回归时,如果回归方程包含交叉项,那么通常我们会对变量进行平均。

那么为什么这么做呢?有的人的解释是消除多重共线性。那你为什么这么做?有些人的解释是消除多重共线性。

然而,正如我之前所写的,在计量经济学领域,如果我们关注系数,扩大样本几乎是解决多重共线性的唯一方法。

其他方法要么导致参数不一致,要么欺骗自己。

因此,如果期刊中的文章意识到多重共线性的问题,他们就不会讨论它,更不用说解决它了。

至于我们为什么要求平均值,我们不妨写一点关于线性投影的内容(根据伍德里奇书中的方法):如果我们不求平均值,OLS就是线性投影;但是如果我们求平均值:那么我们实际上可以得到:所以实际上,这两种方法计算的系数可以用上面的三个方程互相计算。

相应地,系数的标准偏差也可以使用上述三个方程来计算。

换句话说,如果进行去平均回归,那么非平均回归结果(包括系数和方差)可以使用上述三个方程来计算。如果进行了没有解平均的回归,那么解平均的回归结果(包括系数和方差)也可以使用上述三个方程来计算。

你告诉我这解决了多重共线性?你在开玩笑吗?如果你不相信,可以做一个简单的小模拟:ClearSetobs 100 gen X1 = Rnormal()* SQRT(2)+1//MEAN1 gen x2 = 2 * X1+Rnormal()+1//MEAN3 gen x12 = X1 * X2标量Beta 1 =-3标量Beta 2 =-1标量Gamma = 1 gene = Beta 1 * X1+Beta 2 * x2+Gamma * x12+archi 2(2)//demanegen _ X1 =均值(X1)egen Eman _ x2 =均值(x2gendemean

特别要注意是否平均,交叉项的系数与标准误差相同,所以如果我们只关注交叉项,例如在DID中,是否平均是可以的。

那么这种转换解决多重共线性问题了吗?有些人认为:看,相关系数要小得多!它不能解决多重共线性吗?请注意,多重共线性取决于偏相关系数。事实上,如果我们做这个回归,你会发现两个回归的平方基本相同。

这不是自欺欺人。为什么?有些人还说,平均后,它确实更容易变得重要。难道不是因为多重共线性吗?没有。

去平均后更容易显著,因为去平均后x1和x2之前的系数不同。参考上面我写的三个方程的结论,这相当于增加一个系数,所以更容易有意义。

当然,这也不是绝对的。例如,在上面的模拟中,我通过一个特殊的设置表明,在平均之后,它甚至可能不那么重要。

请注意,我在这里只是说解平均的方法不是为了解决多重共线性问题,我也不是说解平均的方法是错误的。

事实上,去平均是标准做法。

为什么?如果我们计算偏差效应;及其期望值;也就是说,解平均后x1的系数就是x1对y的平均效应。

如果我们使x1的系数不显著,但交叉项的系数显著,表明x1平均对y没有影响,但x1对y有影响,其影响随x2而变化。

然而,平均来说,x1对y没有影响。

总而言之,事实上,两种不求平均值的方法是等价的,但是求平均值后的系数更容易解释,所以我们通常在回归时用平均值。

这与多重共线性无关。

此外,这个例子还可以回答为什么我们需要描述性统计。

我在这里提到)这里给我们的一个启示是,当我们阅读回归表时,特别是当我们遇到交叉项时,我们必须结合描述性统计。

例如,如果一些回归结果没有显著平均,那么将报告非平均结果。如果将描述性统计与上述三个方程相结合,就可以恢复真实的平均偏差效应。

有经验的学者在阅读文章时不会被这些小技巧弄糊涂。

You may also like...

发表评论