据我所知, 大多数的 JSON格式SERDE期望.json
文件存储,每行一个记录。
我有一个S3桶多行缩进.json
文件(不控制源),我想使用亚马逊雅典娜查询(虽然我想这也同样适用于蜂巢一般)。
- 是否有一个SERDE格式在那里,能够解析多行缩进
.json
文件? - 如果没有一个SERDE格式要做到这一点:
- 是否有处理类似这样的文件,最好的做法?
- 我应该考虑使用像蟒蛇不同的工具压扁这些记录呢?
- 有没有编写自定义格式SERDE的标准方法,所以我可以写一个自己?
- 是否有处理类似这样的文件,最好的做法?
示例文件正文:
[
{
"id": 1,
"name": "ryan",
"stuff: {
"x": true,
"y": [
123,
456
]
},
},
...
]