布隆过滤器介绍

布隆过滤器（Bloom Filter）由 Burton Howard Bloom 在 1970 年提出，是一种空间效率高的概率型数据结构。它专门用来检测集合中是否存在特定的元素。

布隆过滤器带有以下特点：

布隆过滤器原理

布隆过滤器（Bloom Filter）的核心是实现一个超大的位数组和几个哈希函数。

假设位数组的长度为m，哈希函数的个数为k，以上图为例。
具体操作流程如下：

假设集合里面有3个元素 {x,y,z}，哈希函数的个数为3。首先将位数组进行初始化，将里面每个位都设置为0。
对于集合里面的每一个元素，将元素依次通过3个哈希函数进行映射，每次映射都会产生一个哈希值，这个值对应位数组上面的一个点，然后将位数组对应的位置标记为1。
查询 W 元素是否存在集合中的时候，同样的方法将 W 通过哈希映射到位数组上的3个点。
如果3个点的其中有一个点不为1，则可以判断该元素一定不存在集合中。反之，如果3个点都为1，则该元素可能存在集合中。
注意：此处不能判断该元素是否一定存在集合中，可能存在一定的误判率。
可以从图中可以看到：假设某个元素通过映射对应下标为4、5、6这3个点。虽然这3个点都为1，但是很明显这3个点是不同元素经过哈希得到的位置，因此这种情况说明元素虽然不在稽核中，也可能对应的都是1，这是误判率存在的原因。

布隆过滤器添加元素