我有两个数据集。 第一个是:
countyGroup income other_data_
1 20990 …
2 25622 …
3 24289 …
4 27391 …
5 23326 …
6 19261 …
7 15197 …
8 11132 …
第二个是:
countyGroup state county other_data
1 IL 123 …
1 IL 123 …
2 MI 365 …
1 IL 123 …
3 AK 65 …
4 IL 546 …
5 MI 689 …
6 AK 32 …
可变countyGroup
唯一标识双方state
和county
。 第二个数据集包含countyGroup
, state
和county
。 第一个数据集合中只有countyGroup
。 我需要生成两个变量( state
和county
的第一个数据集)。
我试着用匹配的值merge
:
use dataset1
merge 1:m countyGroup using dataset2, keepusing(state state cntyfp) update replace
我得到的是重复的行,结果......我试过1:1
它没有工作......我可以随时drop
那些重复的行,但我想从一开始就正确合并。