通常我用hashlib和使用。适用(哈希)函数匿名我的数据。
现在,我尝试一种新的方法,可以想象我有以下的DF称为“数据”:
贡献者 - 量所许
埃里克 - 10
弗兰克 - 28
约翰 - 49
弗兰克 - 77
芭芭拉 - 31
我想通过转动名称全部变成“PERSON1”匿名化“ PERSON2”等等,像这样:
贡献者 - 量所许
PERSON1 - 10
PERSON2 - 28
Person3可能 - 49
PERSON2 - 77
person4 - 31
所以,我虽然第一次是总结的名字列,因此名称连接到独特的索引和我的使用该指数对“人”后的数字。
所以,现在的IM停留在怎么做我通过迭代部分data.name
列,例如通过“Person3可能”看在总结数据帧的索引和替换实际名称。
到目前为止我的代码
counter = 0
for names in data.contributor:
if names == summarize.contributor[counter]:
print(summarize.contributor[counter])
data.contributor.replace(summarize.contributor[counter], "Person %d" % counter)
counter = counter + 1
我的想法是把名字在名单+索引,但我想那里有一个更快的方法。 搜索“安东尼”只是一个测试,看看我的代码是工作。