亚马逊EC2与亚马逊EMR（闭合）(Amazon EC2 vs. Amazon EMR [close

我已经实现在蜂巢的任务。目前，它是我的单节点集群上工作的罚款。现在，我打算将其部署到AWS。

我不知道的东西AWS。如果我打算再部署它，我应该选择亚马逊EC2或Amazon EMR？

我想提高我的任务的性能。哪一个更适合我和可靠吗？如何对他们的做法？我听说我们还可以注册我们的虚拟机的设置，因为它是在AWS上。可能吗？

请尽快给我建议。

非常感谢。

Answer 1:

EMR是EC2实例的安装并在其上配置的Hadoop（以及任选的蜂巢和/或猪）的集合。如果您正在使用群集运行Hadoop的/蜂房/猪的工作，EMR是要走的路。相比于EC2实例的实例EMR花费一点点额外的费用。今天在亚马逊的价格快速检查表明，小EC2实例价格为$ 0.08 /小时，而小EMR实例价格为$ 0.015 /小时的额外费用。在我看来，这是完全值得付出额外的钱给自己节省安装和设置的Hadoop（与Hive和Pig一起），创建和维护以及AMI和使用它的麻烦。此外，电子病历的版本Hadoop和蜂巢对蜂巢Apache的一些补丁不可用（ATLEAST，目前还没有）。如果你使用EC2，你可能会使用Apache Hadoop和配置单元（或者可能是，在Cloudera的分布），不会有机会获得这些修补程序（像S3或类似原生支持命令ALTER TABLE my_table RECOVER PARTITIONS

参考文献：