蜂巢在HBase的VS蜂巢在HDFS(Hive over HBase vs Hive over HD

2019-07-30 16:24发布

我的数据不需要实时被加载,所以我没有使用HBASE,但我想知道是否有MR乔布斯使用HBASE的任何性能优势,不应该联接更快由于索引的数据?

任何人有任何基准?

Answer 1:

一般来说,蜂巢/ HDFS会比HBase的显著快。 HBase的坐在HDFS的顶部,这样就又增加了一层。 HBase的速度会更快,如果你正在寻找了个人记录,但你不会使用MR工作了点。



Answer 2:

HBase的对比蜂巢的性能:

基于HBase的,蜂巢,蜂巢和对HBase的结果:看来,这两种方法之间的性能相媲美。

蜂箱HBase的性能



Answer 3:

尊敬:)我想告诉你,如果你的数据是不是真实的,你也想为MapReduce作业,然后只去不亦乐乎了作为网络日志可以通过Hadoop的MapReduce的程序处理,并存储在HDFS HDFS。 同时,蜂巢支持在HDFS位置数据的快速阅读,基本的SQL,联接和批量数据加载到数据库蜂房。
由于蜂巢还为我们提供
批量处理/实时(如果可能)
以及像SQL接口
内置优化的map-reduce
大数据的分区是与HDFS和帮助更多的兼容,以减少HBase的层否则,如果您添加HBase的这里,那么这将是多余的功能,为你:)



文章来源: Hive over HBase vs Hive over HDFS