从pyspark AGG功能INT(From pyspark agg function to int

2019-11-05 08:33发布

我通过pyspark条件计数行

df.agg(count(when((col("my_value")==0),True))).show()

它的工作原理如我所料。 那我该怎么提取物表现出在表中存储到一个Python变量的值?

Answer 1:

如果你只是想算Trues(CEROS),你最好这样做:

from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]

正如你所看到的,也没有必要改变CEROS为真指望他们。



文章来源: From pyspark agg function to int
标签: pyspark