我试图以编程方式加载dynamodb表到HDFS(通过Java,而不是分群),我不能在线上如何做到这一点找到的例子,所以以为我会下载一个包含org.apache.hadoop.hive.dynamodb的罐子,逆向工程的过程。
不幸的是,我无法找到该文件,以及:(。
可能有人为我解答以下问题(按优先顺序排列)。
- 加载一个dynamodb表到HDFS(可传递给映射器作为表输入格式)Java示例。
- 含有org.apache.hadoop.hive.dynamodb罐子。
谢谢!
我试图以编程方式加载dynamodb表到HDFS(通过Java,而不是分群),我不能在线上如何做到这一点找到的例子,所以以为我会下载一个包含org.apache.hadoop.hive.dynamodb的罐子,逆向工程的过程。
不幸的是,我无法找到该文件,以及:(。
可能有人为我解答以下问题(按优先顺序排列)。
谢谢!
这是在hive-bigbird-handler.jar
。 不幸的是AWS不提供任何来源或它至少Java文档。 但你可以找到一个EMR集群的任何节点上的罐子:
/home/hadoop/.versions/hive-0.8.1/auxlib/hive-bigbird-handler-0.8.1.jar
你可能想结帐这篇文章:
不幸的是,亚马逊还没有发布蜂房bigbird-handler.jar,这是考虑到它的实用性一个耻辱的来源。 特别值得注意的是,现在看来,这还包括Hadoop的输入和输出格式的内置支持,因此可以直接在MapReduce作业写,直接写入DynamoDB。
提示:搜索hive-bigbird-handler.jar
去有趣的部分... ;-)
1 -我不知道有任何这样的例子,但你可能会发现这个库非常有用。 它提供InputFormats,OutputFormats和可写类读取和写入数据到Amazon DynamoDB表。
2 - 我不认为他们已经将其提供公开。