首页   

群友们聊聊经济学界的“网红”方法Bartik IV, 我都懂它的原理了.

计量经济圈  · 财经  · 3 天前

主要观点总结

文章介绍了计量经济圈的活动和内容,重点介绍了Bartik IV方法的应用和原理,包括其在经济学中的用途和与普通IV的区别。此外,文章还介绍了如何使用软件操作Bartik IV,并通过一个例子分析了其结果。最后,文章提到了计量经济圈社群的特征,并建议积极进取的中青年学者到社群交流探讨。

关键观点总结

关键观点1: Bartik IV方法的介绍和应用

Bartik IV是一个工具变量,用于帮助经济学者分析某些经济现象的真正原因。它通过结合地区初始产业结构和全国各行业增长率,预测地区未来的就业或经济增长变化。它在经济学中的应用广泛,如劳动力市场、国际贸易、移民和政府政策等领域。相比普通IV,Bartik IV在某些情况下能更准确地分析全国性的冲击对不同地区的差异化影响。

关键观点2: 软件操作及结果分析

使用Stata和R等统计软件可以实现Bartik IV。主要步骤包括计算每个地区的行业占比、找到全国各行业的增长率、使用两阶段最小二乘法(2SLS)分析结果等。通过一个研究中国进口对美国制造业就业影响的例子,展示了如何分析Bartik IV的结果。

关键观点3: 计量经济圈社群的介绍

计量经济圈社群是一个热情互助、前沿趋势、社科资料和科研牛人最多的社群。文章建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,互相成就彼此。


正文

图片

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

1.Bartik IV构建操作程序和步骤, 使用该IV策略的AER数据和code及中英文文献,2.此文的研究发现, 可能会与AER“上山下乡”一样充满争议, 连续DID, 队列DID和Bartik IV,3.AER: 中国城乡迁徙与企业生产, 移动份额工具变量法Bartik,4.Bartik工具变量是什么? 份额移动法IV应用越来越多,5.TOP5前沿: 时下最流行的移动份额工具变量SSIV研究设计指南!6.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单, 7.不研究人, 经济学开始研究鸟儿了, DID-TWFE, Bartik IV, 零第一阶段ZFS检验值得参考, 8.Bartik工具变量法最新发展和使用方法流程图总结

社群里群友对Bartik IV的讨论,挺有意思的。

稍微将上面的对话扩展一下,文字版如下。若对Bartik IV代码和完整构建过程感兴趣,可以查看今天推文中的第二篇《Bartik IV方法详解及其在经济学中的应用》。
  1. Bartik IV 是啥?

想象一下,你有很多个小城市,每个城市都有自己擅长的产业,比如有的城市是汽车工厂多,有的城市是服装厂多。现在,全国范围内,汽车行业发展得特别快,服装行业有点不景气。

Bartik IV 就像一个“预测器”,它能帮你猜到:那些一开始汽车产业就比较发达的城市,可能会因为全国汽车行业的蓬勃发展而有更多的就业机会;而那些服装产业占比较高的城市,可能就会因为全国服装行业的衰退而面临一些就业压力。

简单点讲,Bartik IV 就是利用一个地区一开始的产业结构,结合全国各个行业的增长情况,来预测这个地区未来的就业或者经济增长变化。它就像在说:“你之前是干啥的,很大程度上决定了你会受到哪些全国性浪潮的影响。”

用更专业的术语来说,它是一个工具变量(IV),用来帮助经济学者分析某些经济现象的真正原因,而不是表面上的相关性。

公式解读(不用太纠结):

那个看着有点复杂的公式 Bl=∑kzlkgk,其实就是干了这么件事:

zlk:代表在城市 l,行业 k(比如汽车行业)占总就业的比例。就是说,这个城市有多少比例的人是干这个行业的。

gk:代表全国范围内,行业 k(比如汽车行业)的增长率。就是说,这个行业在全国范围内发展得怎么样。

Bl:就是 Bartik IV 的结果,它预测了城市 l 的就业增长情况。

公式的意思就是把每个行业在当地的占比,乘以这个行业在全国的增长情况,然后加起来,就能得到一个对当地整体就业增长的预测。

  1. Bartik IV 的原理是啥?

Bartik IV 的核心想法是,一个地区的经济变化,一部分是受全国大趋势影响的,一部分是受本地自身因素影响的。Bartik IV 想要把全国大趋势的影响给分离出来。

它认为,一个地区一开始的产业结构是相对固定的,不会很快发生大的变化。而全国各个行业的发展是大家共同面对的“冲击”。如果一个地区恰好在那些发展快的行业里“押对了宝”,那么它的经济就更有可能跟着发展。

这就好比一艘艘小船(各个地区),它们在不同的海域(有不同的产业结构)。突然来了一股大风(全国性的行业冲击)。有些船因为船帆(产业结构)的设计,更容易被风推动前进,而有些船可能就比较吃力。Bartik IV 就是想通过分析每艘船的“船帆”和“风向”,来预测它们会驶向何方。

通过这种方法,经济学家希望能找到更可靠的证据,证明某些因素(比如贸易政策、移民等)对当地经济的真正影响,而不是被其他本地因素干扰。

  1. Bartik IV 在经济学里都干啥?

Bartik IV 用途广泛,经济学的很多领域都能看到它的身影:

研究劳动力市场:比如,想知道工资上涨多少才会吸引更多人来工作(劳动力供给弹性),可以用 Bartik IV 来预测哪些地区因为全国性的行业需求增加而更容易招到人。

研究国际贸易:比如,想知道中国进口商品增加对美国当地就业有什么影响,可以用 Bartik IV 来预测哪些地区因为一开始就有很多容易被进口替代的产业而受到的冲击更大。

研究移民:比如,想知道移民涌入对当地工资和就业有没有影响,可以用 Bartik IV 来预测哪些地区因为一开始就有较多移民来源地的产业而更容易受到移民的影响。

研究政府政策:比如,想知道政府的财政支出(比如国防开支)对地方经济有没有好处,可以用 Bartik IV 来预测哪些地区因为有较多与国防相关的产业而更容易受益。

只要你想研究某个全国性的“冲击”对不同地区的差异化影响,并且你能找到一个跟地区初始特征相关的指标,Bartik IV 就可能派上用场。

  1. Bartik IV 比普通 IV 厉害在哪儿?

普通的工具变量有时候很难找,而且可能跟我们想研究的结果本身也有一些联系,这就让结果不太可靠。Bartik IV 在某些情况下就显得更聪明一些:

能抓住共同的冲击:它专门用来分析全国性的、大家一起遇到的“事儿”对不同地方的不同影响。

能减少本地因素的干扰:通过看一开始的产业结构,它能更好地排除掉那些本地自己发生的、跟全国趋势没啥关系的因素。

能用更多的数据信息:它能同时考虑地区、时间和行业等多个方面的数据,信息量更大。

跟双重差分有点像:它的思路跟我们常用的双重差分方法很像,都是看不同群体在同一个冲击下的不同反应。

更关注“外生”的部分:它用的初始产业结构和全国趋势,通常被认为是当地自己控制不了的,所以更“外生”,更能说明因果关系。

能处理更复杂的情况:有些时候,我们想研究的影响因素是连续变化的,而不是简单的“有”或者“没有”,Bartik IV 也能很好地处理。

当然,Bartik IV 也不是万能的,它的有效性也取决于一些假设是否成立,比如一开始的产业结构跟后来的结果没有直接的、我们没考虑到的联系。

  1. 怎么用软件操作?

简单讲,用 Stata 和 R 这些统计软件都可以实现 Bartik IV。主要步骤就是:

  1. 算每个地区的行业占比。

  2. 找到全国各个行业的增长率。

  3. 把每个地区的行业占比乘以对应的全国增长率,然后加起来,得到 Bartik IV。

  4. 用两阶段最小二乘法(2SLS)来分析结果。

不用太担心代码细节,知道大概流程就行。

  1. 举个例子分析一下结果?

一个很经典的例子,研究中国进口对美国制造业就业的影响。

他们的数据:美国各个地区的制造业就业变化情况,以及这些地区受到中国进口的影响程度。

他们想研究的:中国进口增加到底有没有导致美国制造业就业减少?

他们的 Bartik IV:他们用的是每个地区过去的产业结构(比如哪些地区一开始就有很多容易被中国进口替代的产业),结合其他高收入国家从中国的进口增长情况。他们认为,其他高收入国家从中国的进口增长,可以作为一个比较好的工具,来预测美国从中国的进口增长,但又不会直接受到美国本地就业情况的影响。

他们的结果:研究发现,中国进口的增加确实对美国制造业就业产生了负面影响。具体来说,进口越多,当地制造业就业减少得就越多。

怎么解读结果:Bartik IV 的分析结果告诉我们,进口敞口(就是受进口影响的程度)和制造业就业变化之间存在因果关系。系数的大小告诉我们,进口每增加多少,就业会相应减少多少。

需要注意的地方:这个研究的关键假设是,过去的产业结构跟美国本地特有的、同时也会影响其他高收入国家进口需求的因素没有关系。研究人员也做了一些检验来确保这个假设是合理的。

*如果对Bartik IV代码和完整构建过程感兴趣,可以查看今天推文中的第二篇《Bartik IV方法详解及其在经济学中的应用》。

图片

*可以进一步到社群交流讨论计量问题。
内生性问题的拓展性阅读 ,0.看完顶级期刊文章后, 整理了内生性处理小册子;1.“内生性” 到底是什么鬼? New Yorker告诉你;2.Heckman两步法的内生性问题(IV-Heckman);3.IV和GMM相关估计步骤,内生性、异方差性等检验方法;4.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题;5.毛咕噜论文中一些有趣的工具变量!;6.非线性面板模型中内生性解决方案;7.内生性处理的秘密武器-工具变量估计;8.内生性处理方法与进展;9.内生性问题和倾向得分匹配;10.你的内生性解决方式out, ERM独领风骚;11.工具变量IV必读文章20篇, 因果识别就靠他了;12.面板数据是怎样处理内生性的;13.计量分析中的内生性问题综述;14.工具变量IV与内生性处理的解读;15.一份改变实证研究的内生性处理思维导图;16.Top期刊里不同来源内生性处理方法;17.面板数据中heckman方法和程序(xtheckman);18.控制函数法CF, 处理内生性的广义方法;19.二值选择模型内生性检验方法;20.2SRI还是2SPS, 内生性问题的二阶段CF法实现;21.内生变量的交互项如何寻工具变量;22.工具变量精辟解释, 保证你一辈子都忘不了,23.审稿人: 为啥你不展示Y对工具变量Z的简约式回归结果呢?24.Two Sample IV, 双样本二阶段工具变量回归, TS2SLS充分利用2份数据的信息,25.Stata自救行动: 高维固定效应HDFE, 弱工具变量稳健性估计, 工具变量SVAR
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节  | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

图片

图片


© 2024 精读
删除内容请联系邮箱 2879853325@qq.com