]> arthur.barton.de Git - bup.git/blobdiff - lib/bup/bloom.py
do_bloom(): remove unused "count" variable
[bup.git] / lib / bup / bloom.py
index 5444fd5d0a67717e561bb23d92800a36dcfa1ade..c90a1fdf40bd812bea35d3ee2d7e28e22a9fc499 100644 (file)
@@ -4,7 +4,7 @@ There are four basic things to consider when building a bloom filter:
 The size, in bits, of the filter
 The capacity, in entries, of the filter
 The probability of a false positive that is tolerable
-The number of bits readily available to use for addresing filter bits
+The number of bits readily available to use for addressing filter bits
 
 There is one major tunable that is not directly related to the above:
 k: the number of bits set in the filter per entry
@@ -72,7 +72,7 @@ reasonable size.
 Based on these parameters, a combination of k=4 and k=5 provides the behavior
 that bup needs.  As such, I've implemented bloom addressing, adding and
 checking functions in C for these two values.  Because k=5 requires less space
-and gives better overall pfalse_positive perofrmance, it is preferred if a
+and gives better overall pfalse_positive performance, it is preferred if a
 table with k=5 can represent the repository.
 
 None of this tells us what max_pfalse_positive to choose.
@@ -94,6 +94,9 @@ _total_steps = 0
 bloom_contains = _helpers.bloom_contains
 bloom_add = _helpers.bloom_add
 
+# FIXME: check bloom create() and ShaBloom handling/ownership of "f".
+# The ownership semantics should be clarified since the caller needs
+# to know who is responsible for closing it.
 
 class ShaBloom:
     """Wrapper which contains data from multiple index files. """