高考考试网
当前位置: 首页 高考资讯

stata怎么测数据相关性系数(倾向得分匹配PropensityScore)

时间:2023-06-06 作者: 小编 阅读量: 4 栏目名: 高考资讯

stata怎么测数据相关性系数倾向得分匹配的通俗解析及在Stata里的运用徐惟能·4个月前倾向得分匹配法是一种研究方法,它在研究某项治疗、政策、或者其他事件的影响因素上很常见。对于经济、金融学领域来说,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者比如研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。这样的比较显然是不科学的,因为比较的基础并不同。

stata怎么测数据相关性系数?倾向得分匹配(Propensity Score Matching) 的通俗解析及在Stata里的运用,我来为大家科普一下关于stata怎么测数据相关性系数?下面希望有你要的答案,我们一起来看看吧!

stata怎么测数据相关性系数

倾向得分匹配(Propensity Score Matching) 的通俗解析及在Stata里的运用

徐惟能· 4 个月前

倾向得分匹配法是一种研究方法,它在研究某项治疗、政策、或者其他事件的影响因素上很常见。对于经济、金融学领域来说,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者比如研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。如果我们简单地将是否执行了某项事件作为虚拟变量,而对总体进行回归的话,参数估计就会产生偏误,因为在这样的情况下,我们只观察到了某一个对象他因为发生了某一事件后产生的表现,并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的,因为比较的基础并不同。

通俗地说,我们真正要做的是考虑,如果拿小明来说,小明读了研究生和小明没有读研究生,他的收入会差多少?可是小明已经读了研究生,我怎么才能估计出他要是不读研究生,他的收入会是多少呢?

于是,我们引入“倾向得分匹配”这样一种研究方法。英文叫Propensity Score Matching。这种方法能让我们从一大堆没有读研究生的人群中(也就是我们的总体样本的一个子集),对每个人读研究生的概率进行估计,然后选出和小明具有非常相似的去读研究生的概率,可是没有去读的同学小刚——作为小明的对照,然后再来看他们的区别。当样本中的每个研究生”小明“都找到了匹配的非研究生”小刚“,我们便能对这两组样本进行比较研究了。

1. 所以第一步,我们要对总体样本执行probit或者logit模型,然后估计出每一个观测对象读研究生的概率是多少。以probit模型为例,在stata中,执行以下命令:

probit [dependent var] [independent var]

其中,[dependent var]是一个0或1的二进制变量,1代表该对象读了研究生,否则是0。

2. 对每一个观测值,我们根据估计出来的probit模型,算出他读研究生的概率是多少。Stata中,执行如下命令:

predict pscore, p

其中,pscore是定义的记录每个观测对象概率的变量名称。

3. 使用psmatch2命令,让Stata帮你对于每个读了研究生的观测对象,找出一个与之具有最接近的概率值的,可是没有读研究生的观测对象:

psmatch2 [dependent var], pscore(pscore) noreplacement

其中,(pscore)是在第二步中生成的那个记录对象概率的变量,noreplacement是一个选项,使得任何读了研究生的观察对象的对照对象都具有唯一性,换言之,只能1对1匹配。

4. Stata会在你的数据中自动添加几个变量,其中_id是自动生成的每一个观测对象唯一的ID;_treated表示某个对象是否读了研究生,如果读了,_n表示的是他被匹配到的对照对象的_id;_pdif表示一组匹配了的观察对象他们概率值的差。

做好了这些,你就完成了一个最简单的1对1的倾向得分匹配。psmatch2还提供多种匹配方法,比如在一定的半径范围内的临近匹配、在一定概率阀值内的全部匹配等等。具体的可以在Stata中输入help psmatch2查看所有可用的选项。

需要注意的是,psmatch2会在每一轮匹配的时候重新刷新_ID,所以如果比如你需要对psmatch2加入if语句,进行多次循环匹配的话,需要在每一次结束的时候即使将match的结果使用你自己数据的ID导出到其他变量,否则所有本轮_ID以及_n的信息会在下一轮匹配中被清除,事后你将无法判断对照对象究竟为哪个。

    推荐阅读
  • 丘鹬是国家保护动物吗(丘鹬是不是国家保护动物)

    接下来我们就一起去研究一下吧!丘鹬是国家二级保护动物。丘鹬体长35厘米,是一种涉禽,体型肥胖,腿短,嘴长且直。栖息于阴暗潮湿、林下植物发达、落叶层较厚的阔叶林和混交林中,有时也见于林间沼泽、湿草地和林缘灌丛地带。夜行性的森林鸟。白天隐蔽,伏于地面,夜晚飞至开阔地进食。主要以昆虫幼虫、蚯蚓、蜗牛等小型无脊椎动物为食。

  • 东芝笔记本商用(东芝笔记本产品全线改名Dynabook)

    东芝笔记本产品全线改名Dynabook东芝决定不再使用用Toshiba这一品牌名,东芝消费级产品集团(TCS)宣布在北美、欧洲、新加坡、加拿大以及澳大利亚市场更名为Dynabook东芝消费部门的主营业务是PC产品,这一改变主要原因是去年6。

  • 斯柯达昕动老款和新款有什么不同(斯柯达昕动用车调查)

    保险费用调查2020款昕动售价7.79万元起,经过我们调查,售价9.99万元的“2020款1.5L自动舒适版”热度最高,销量最好。根据调查的保险费用结果来看,昕动在购买100万三责、车损险、交强险后,首年总保费在5140元左右。油费调查昕动1.5L6挡自动NEDC综合油耗为5.6L。以目前92号汽油每升7.3元,计算昕动油费,行驶20000km是10366元,三年60000km是31098元,平均每月约863元。所以,从实用性以及用车成本两方面来看,昕动是一辆挺不错的两厢车。

  • 高颜值凉茶排行榜(当代青年饮品图鉴)

    九芝堂健康产业依靠自己巨大优势,也上架了九芝堂凉茶植物饮料。由此可见,凉茶这一品类并没有过时,只是缺乏令人兴奋的新产品。与传统凉茶不同的是,和其正萂茶系列首批上市了栀子乌龙茶和洛神花红茶两款单品,均以凉茶为基底,但在功效上各有侧重。栀子乌龙茶,栀子护肝利胆,乌龙茶提神消疲,让产品具有温润降燥的功效;洛神花红茶,洛神花清暑解火,红茶生津清热,让产品具有清火醒神的功效。

  • 腾讯大王卡19元套餐(阿里小宝卡19元套餐详情)

    2020年2月28日起,阿里宝卡用户新增百度系与网易系APP专属应用免流服务,免流服务有效期至2020年12月31日,后续如无特殊情况,仍可继续享有该免流服务。当月可申请打开,超过40GB依据标准流量计费。

  • 什么是水鹿指名亚种(长颈鹿指名亚种)

    水鹿指明亚种并不是说就不是水鹿了,水鹿指名亚种也是水鹿,换句话来说就是成熟了的雄水鹿,而且体型健硕高大,满足于水鹿指明亚种的要求,归根结底还是水鹿中比较强壮的一部分群体。这样的一部分群体因为身体条件的优势往往在种群中是占据主导地位的,因为在种群的迁移和各类斗争中,这一部分群体能够在水鹿群中起着重要的作用。水鹿指明亚种热爱水,这是它们的天性,故栖息地处往往会有水源和草类,他们喜欢吃嫩枝叶和鲜嫩的草。

  • 高压锅炖鹅肉需要多久 高压锅炖鹅肉要多长时间

    2、用啤酒来炖鹅肉,不要用清水,全部用啤酒,然后小火慢炖。

  • 加人通过率高的20句话(聊天加好友套路技巧分享)

    加人通过率高的20句话?你怎么换号码了,加一下;我换微信号了,加我一下;,现在小编就来说说关于加人通过率高的20句话?下面内容希望能帮助到你,我们来一起看看吧!我换微信了,这是我的新号。你上个星期让我加你的,差点忘了。竟然这样也能找到你,加个好友吧。你好,朋友推荐听说你是这方面的专家,想请教您几个问题。

  • 重庆渝川高速公路(渝蓉高速有望6月前全线通车)

    渝蓉高速有望6月前全线通车。渝蓉高速是目前重庆和成都两地间最短的一条高速,全线通车后,重庆市民自驾到成都,经渝蓉高速只需2.5小时。渝蓉高速简阳至川渝省界段开通后,渝蓉高速四川段仅剩20余公里未打通。其中,成洛互通、洛带互通基本成型,渝蓉高速剩余路段将于今年6月前完工并实现通车,这意味着渝蓉高速全线有望于今年6月前实现通车。届时,从重庆出发,经渝蓉高速,2.5小时可到成都。

  • 椰子片热量(椰子片热量是多少)

    以下内容大家不妨参考一二希望能帮到您!椰子片热量椰子片热量:475大卡。椰子片的热量其实不是很高,处于一个中间的位置,相对于很多零食来说,它的热量已经算低了,但是减肥期间不要吃太多了,不利于减肥,但是是可以吃的,少量吃是没有为题的,不属于高油炸,高糖的食物,而且还很健康。