重塑长格式多值Dataframes与熊猫(Reshape Long Format Multivalu

2019-08-01 17:15发布

我想谈谈:

DateTime                     ColumnName        Min      Avg      Max                                                                                      
2012-10-14 11:29:23.810000   Percent_Used       24       24       24
2012-10-14 11:29:23.810000   Current_Count  254503   254503   254503
2012-10-14 11:29:23.810000   Max           1048576  1048576  1048576
2012-10-14 11:34:23.813000   Percent_Used       24       24       24
2012-10-14 11:34:23.813000   Current_Count  254116   254116   254116
2012-10-14 11:34:23.813000   Max           1048576  1048576  1048576

成数据帧,其中的DateTime是否是唯一的(指数)和列:

DATATIME,Percent_Used_Min,Percent_Used_Avg,Percent_Used_Max,Current_Count_Min,Current_Count_Avg,Current_Count_Max,MAX_MIN,Max_Avg,Max_Max

基本上,我想模仿的r熔融/铸造没有进入分层索引或堆叠dataframes。 我似乎无法得到准确上述播放堆栈/拆散,融化,或转动/ pivot_table - 有没有做到这一点的好办法?

作为一个例子,R中它会是这样的:

dynamic_melt = melt(dynamic, id = c("DateTime", "ColumnName"))
recast = data.frame(cast(dynamic_melt, DateTime ~ ...))

以上数据是可变的(即的ColumnName的值不会永远是同样的事情,可能有更多或更少的人,不同的名称)。

Answer 1:

有一个meltpandas.core.reshape

In [52]: melted = reshape.melt(df, id_vars=['DateTime', 'ColumnName'])

In [53]: melted.set_index(['DateTime', 'ColumnName', 'variable']).value.unstack([1, 2])
Out[53]: 
ColumnName                  Percent_Used  Current_Count      Max  Percent_Used  Current_Count      Max  Percent_Used  Current_Count      Max
variable                             Min            Min      Min           Avg            Avg      Avg           Max            Max      Max
DateTime                                                                                                                                    
2012-10-14 11:29:23.810000            24         254503  1048576            24         254503  1048576            24         254503  1048576
2012-10-14 11:34:23.813000            24         254116  1048576            24         254116  1048576            24         254116  1048576

该栏目最终被一个多指标,但如果这是一个大忌你只是Concat的名字,使之成为正规指数。



文章来源: Reshape Long Format Multivalue Dataframes with Pandas