Stata的。 如何在1匹配值:M的关系?(Stata. How to match values

2019-10-18 05:22发布

我有两个数据集。 第一个是:

countyGroup income  other_data_
    1       20990   …
    2       25622   …
    3       24289   …
    4       27391   …
    5       23326   …
    6       19261   …
    7       15197   …
    8       11132   …

第二个是:

countyGroup state   county  other_data
    1       IL      123     …
    1       IL      123     …
    2       MI      365     …
    1       IL      123     …
    3       AK      65      …
    4       IL      546     …
    5       MI      689     …
    6       AK      32      …

可变countyGroup唯一标识双方statecounty 。 第二个数据集包含countyGroupstatecounty 。 第一个数据集合中只有countyGroup 。 我需要生成两个变量( statecounty的第一个数据集)。

我试着用匹配的值merge

use dataset1
merge 1:m countyGroup using dataset2, keepusing(state state cntyfp) update replace

我得到的是重复的行,结果......我试过1:1它没有工作......我可以随时drop那些重复的行,但我想从一开始就正确合并。

Answer 1:

我们需要了解的重复行(塔塔的术语是“意见”)。 如果它们是相同的所有变量,没有多余的信息,它的清洁,使用最简单的duplicates drop ,让他们走出之前的方式merge

duplicates是用于管理重复的通用工具。

如果在其他变量不同的信息,告诉我们更多关于什么是和你的目标在这里。

(后)与您的数据集,你贴

   merge 1:m countyGroup using dataset2

似乎很好地工作。



文章来源: Stata. How to match values in 1:m relationship?
标签: merge stata