我现在有添加文件夹的内容,以荨麻疹的问题不信任缓存。 我可以将多个文件成功添加到使用蜂巢分布式缓存:
ADD FILE /folder/file1.ext;
ADD FILE /folder/file2.ext;
ADD FILE /folder/file3.ext;
etc.
。
我还看到有一个ADD FILES
(复数),它在我的脑海意味着你可以指定一个目录类似选项: ADD FILES /folder/;
而该文件夹中的一切都将包括(这个作品用Hadoop流-files选项)。 但是,这并不与蜂巢工作。 现在我必须明确添加每个文件。
我这样做不对吗? 有没有一种方法来整过的文件夹的内容,以分布式缓存。
PS我试过通配符ADD FILE /folder/*
和ADD FILES /folder/*
,但失败了。
编辑:
由于蜂巢0.11的这个现在支持这样:
ADD FILE /folder
现在的作品。
我现在用的就是通过文件夹位置蜂巢脚本设置了一个param这样:
$ hive -f my-query.hql -hiveconf folder=/folder
而在我的-query.hql文件:
ADD FILE ${hiveconf:folder}
尼斯和整洁吧!