pyspark access column of dataframe with a dot '

2020-02-06 10:33发布

站内文章 / Spark

15 0

在下西门庆

女 | 书童

私信

可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效，请关闭广告屏蔽插件后再试):

问题:

A pyspark dataframe containing dot (e.g. "id.orig_h") will not allow to groupby upon unless first renamed by withColumnRenamed. Is there a workaround? "`a.b`" doesn't seem to solve it.

回答1:

In my pyspark shell, the following snippets are working:

from pyspark.sql.functions import *
myCol = col("`id.orig_h`")    
result = df.groupBy(myCol).agg(...)

and

myCol = df["`id.orig_h`"]   
result = df.groupBy(myCol).agg(...)

I hope it helps.

标签： apache-spark dataframe pyspark

在下西门庆

女 | 书童

私信

收藏的人(0)

Ta的文章更多文章

2020 年终总结
80%应聘者都不及格的JS面试题
Oracle中复制表的方法（create as select、insert into select、
TP-Link路由器当作交换机使用
互动多媒体展示墙告诉你，科技与文化能碰撞出什么样的火花？
Java的常量接口思考，项目中的常量是放在接口里还是放在类里呢?
python web开发-flask中消息闪现flash的应用
matlab数学实验--第二章

0条评论

还没有人评论过~

pyspark access column of dataframe with a dot '

问题:

回答1:

收藏的人(0)

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮