Na IIPC Technical Speaker Series webinaru održanom 16. prosinca 2021. predstavljeni su rezultati projekta Developing Bloom Filters for Web Archives’ Holdings koji je nastao u suradnji Los Alamos National Laboratory (LANL) Research Library, Nacionalne i sveučilišne knjižnice u Zagrebu i Sveučilišnog računskog centra Sveučilišta u Zagrebu (Srce), a financirao ga je International Internet Preservation Consortium (IIPC).
U radu na projektu, čiji rezultati omogućavaju jednostavniji dolazak do odgovora na pitanje „je li sadržaj ovog URL-a pohranjen u ovom arhivu?", sudjelovali su Martin Klein (voditelj projekta) i Lyudmila Balakireva iz Los Alamos National Laboratory (LANL) Research Library, Draženko Celjak iz Sveučilišnog računskog centra Sveučilišta u Zagrebu te Karolina Holub i Ingeborg Rudomino iz Nacionalne i sveučilišne knjižnice u Zagrebu.
Cilj projekta bio je izgraditi softverski okvir za generiranje Bloom filtera (BF) koji bi web arhivima omogućilo dijeljenje sadržaja arhiva i stvaranje novih usluga poput federiranog pretraživanja više web arhiva. Rezultati projekta uključuju softverski paket za stvaranje BF, pilot federiranog sustava pretraživanja temeljenog na BF, analizu skalabilnosti i izvedivosti inkrementalnih filtera te konceptualni dizajn sustava za dijeljenje i inkrementalno ažuriranje Bloom filtera.
U projektnim aktivnostima korišteni su sadržaji i iskustvo Hrvatskog arhiva weba, a rezultati su primjenjivi na druge arhive internetskog sadržaja u svijetu.
Voditelj projekta, Martin Klein, prilikom prezentacije rezultata projekta je istaknuo da su u okviru projekta ostvareni impresivni rezultati, jasno je prikazano koje sve mogućnosti pruža korištenje Bloom filtera te je uspostavljena vrlo uspješna suradnja i kolaboracija unatoč različitim vremenskim zonama i različitim kontinentima.
Prezentacija Developing Bloom Filters for Web Archives’ Holdings s webinara dostupna je u institucijskom repozitoriju Srca.