hbase过滤器

hbase过滤器filter主要用于提前过滤要操作的数据集,它通过不同过滤器的不同过滤条件过滤数据。一般在以下情况下非常有用:

  • 1、减少要处理的数据量。

  • 2、减少数据集既是减少网络带宽。

  • 3、处理获得特定行、列、列族、值或者时间戳数据集的强大工具。

  • 4、过滤器也用于执行临时分析

我们可以通过hbase show_filters命令查看hbase提供了哪些过滤器:如下

主要过滤器有:

1、FirstKeyOnlyFilte: 只返回每一行的主键值,不带任何参数。

2、KeyOnlyFilter:只返回每个键值的键部分,不带任何参数。

3、Prefixfilter:仅返回以指定行前缀开头的行中存在的那些键值。它将采用前缀的一个参数,即行键。

4、ColumnPrefixFilter:仅返回以指定列前缀开头的列中存在的键值。它需要一个参数,即列前缀。

5、MultipleColumnPrefixFilter:多列前缀过滤器,选择具有匹配特定前缀列的键。它将以列前缀列表作为参数。

6、ColumnCountGetFilter:仅返回行上的前 N 列。它以一个参数为限制。

7、PageFilter:返回表中行的页面大小编号。它需要一个参数,即页面大小。

8、Qualifier Filter:用于根据列限定符进行过滤。

9、ValueFilter:用于根据列值进行过滤。