apache-hbase-medium-object-storage-mob-policies

HBASE-11339引入了Apache HBase介质对象存储(MOB)的功能。该功能可以提高中等尺寸值的低延迟读写访问(理想情况下,我们的测试结果是从100K到10MB),使尺寸值非常适合存储文档,图像和其他中等尺寸的对象[1]。Apache HBase MOB功能通过分离文件引用和MOB对象的IO路径来实现这一改进,将不同的压缩策略应用于MOB,从而降低HBase压缩创建的写入放大率。MOB对象存储在称作MOB区域的特殊区域中。

spark-hbase-dataframe-based-hbase-connector

Spark-HBase连接器利用Spark-1.2.0引入Data Source API(SPARK-3247)。它弥合了简单的HBase Key Value和复杂关联SQL查询之间的差距,使得用户可以在HBase上使用Spark执行复杂的数据分析。HBase DataFrame是一个标准的Spark DataFrame,它可以和任何其他数据源(例如Hive,ORC,Parquet,JSON等)进行交互。