计算基于四个最大的数字产业集中度(Calculate industry concentration

2019-09-29 13:33发布

我试图找到一个变量的四大数字在Stata,因为我想计算基于销售不同群体的行业集中度。 我有多年的企业销售和公司属于基础产业和国家不同的组。

因此,我想找到:

行业集中度=(一种业每年的4最大的销售值 - & - 国家组)/该行业一年全部销售额的总和 - & - 国家组)

我有大约10000左右的企业10岁:

firms   country   year   industry   sales  
    a       usa      1          1     300  
    a       usa      2          1    4000  
    b       ger      1          1     200  
    b       ger      2          1     400  
    c       usa      1          1     100  
    c       usa      2          1     300  
    d       usa      1          1     400  
    d       usa      2          1     200  
    e       usa      1          1    7000  
    e       usa      2          1     900  
    f       ger      1          2     100  
    f       ger      2          2     700  
    h       ger      1          2     700  
    h       ger      2          2     600   

我知道如何找到每个行业国家年集团销售收入的总和:

bysort country industry year: egen sum_sales = sum(sales)

Answer 1:

最大的四家的总和

bysort country industry year (sales): generate four_biggest_sales = sales[_N] + ///
                                      sales[_N-1] + sales[_N-2] + sales[_N-3] 

前提是没有价值sales丢失。 如果只有三个值,那么你需要

max(0, sales[_N-3]) 

有用于两个值,一个值或没有的情况下,类似的校正。

这一切都从基本语法如下by前缀。 请参阅这篇文章的Stata杂志的教程。

如果有missings,那么他们可以通过分离

generate isnotmiss = !missing(sales) 
bysort isnotmiss country industry year (sales): generate four_biggest_sales = sales[_N] + ///
                                                sales[_N-1] + sales[_N-2] + sales[_N-3] 


文章来源: Calculate industry concentration based on four biggest numbers
标签: file stata