我通过pyspark条件计数行
df.agg(count(when((col("my_value")==0),True))).show()
它的工作原理如我所料。 那我该怎么提取物表现出在表中存储到一个Python变量的值?
我通过pyspark条件计数行
df.agg(count(when((col("my_value")==0),True))).show()
它的工作原理如我所料。 那我该怎么提取物表现出在表中存储到一个Python变量的值?
如果你只是想算Trues(CEROS),你最好这样做:
from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]
正如你所看到的,也没有必要改变CEROS为真指望他们。