如何生成和Scala中加载多个S3文件路径,这样我可以使用:
sqlContext.read.json ("s3://..../*/*/*")
我知道我可以使用通配符来读取多个文件,但有什么办法让我可以生成路径? 例如我的文件结构是这样的:BucketName /年/月/日/文件
s3://testBucket/2016/10/16/part00000
这些文件都是jsons。 问题是我需要加载的文件只是spacific持续时间,例如。 说16天然后我需要loado为开始日(10月16日)文件:10月1日至一十六日。
28天的持续时间相同的开始一天我想从09月18阅读
一些能告诉我什么方法可以做到这一点?