需求:要把spark的数据转为json数据,collectAsLIst()返回LIst,但是如果数据量太大,内存肯定不够,所以有什么办法可以一行一行获取
看到limit(n)方法也只能获取前n的数据
相关问题
- Structured Streaming中window不存在问题。
-
spark Dataset
如何按行获取数据
- spark submit 运行多个任务问题,求大神解答
- 实际问下各位公司中的spark集群有几台
- GraphX构建图的时候,顶点数增多了是为什么,求教!
使用foreachParttition可以遍历
应该可以
Skip()
已读过的行,再配合limit()
应该就能实现分页读取数据