我有一个数据集,我想与添加一个字符串,它填补与bfill列“值”丢失的数据。 下面是代码,我有:
import pandas as pd
import numpy as np
df = pd.DataFrame(
{
'category': ['X', 'X', 'X', 'X', 'X', 'X', 'Y', 'Y', 'Y'],
'name': ['A','A', 'B','B','B','B', 'C','C','C'],
'other_value': [10, np.nan, np.nan, 20, 30, 10, 30, np.nan, 30],
'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3],
}
)
print(df)
def fillValue(g):
gNotNull = g.dropna()
wtAvg = str(gNotNull[0])+'5D'
return g.fillna(wtAvg)
ff=pd.DataFrame()
ff["value"] = df['value'].transform(fillValue)
ff
那我从这段代码获得的输出是:
value
0
1
1
1.05D
2
1.05D
3
2
4
3
5
1
6
3
7
1.05D
8
3
该放出来,我想是让回填和是这个样子:
value
0
1
1
25D
2
35D
3
2
4
3
5
1
6
3
7
85D
8
3
我很感激,如果任何人都可以提供帮助。 谢谢