Predstavljeni rezultati projekta Developing Bloom Filters for Web Archives’ Holdings

23. 12. 2021.

Na IIPC Technical Speaker Series webinaru održanom 16. prosinca 2021. predstavljeni su rezultati projekta Developing Bloom Filters for Web Archives’ Holdings koji je nastao u suradnji Los Alamos National Laboratory (LANL) Research Library, Nacionalne i sveučilišne knjižnice u Zagrebu i Sveučilišnog računskog centra Sveučilišta u Zagrebu (Srce), a financirao ga je International Internet Preservation Consortium (IIPC).

U radu na projektu, čiji rezultati omogućavaju jednostavniji dolazak do odgovora na pitanje „je li sadržaj ovog URL-a pohranjen u ovom arhivu?", sudjelovali su Martin Klein (voditelj projekta) i Lyudmila Balakireva iz Los Alamos National Laboratory (LANL) Research Library, Draženko Celjak iz Sveučilišnog računskog centra Sveučilišta u Zagrebu te Karolina Holub i Ingeborg Rudomino iz Nacionalne i sveučilišne knjižnice u Zagrebu.

Cilj projekta bio je izgraditi softverski okvir za generiranje Bloom filtera (BF) koji bi web arhivima omogućilo dijeljenje sadržaja arhiva i stvaranje novih usluga poput federiranog pretraživanja više web arhiva. Rezultati projekta uključuju softverski paket za stvaranje BF, pilot federiranog sustava pretraživanja temeljenog na BF, analizu skalabilnosti i izvedivosti inkrementalnih filtera te konceptualni dizajn sustava za dijeljenje i inkrementalno ažuriranje Bloom filtera.

U projektnim aktivnostima korišteni su sadržaji i iskustvo Hrvatskog arhiva weba, a rezultati su primjenjivi na druge arhive internetskog sadržaja u svijetu.

Voditelj projekta, Martin Klein, prilikom prezentacije rezultata projekta je istaknuo da su u okviru projekta ostvareni impresivni rezultati, jasno je prikazano koje sve mogućnosti pruža korištenje Bloom filtera te je uspostavljena vrlo uspješna suradnja i kolaboracija unatoč različitim vremenskim zonama i različitim kontinentima.

Prezentacija Developing Bloom Filters for Web Archives’ Holdings s webinara dostupna je u institucijskom repozitoriju Srca.

Ilustracija predstavljanja rezultata projekta Developing Bloom Filters for Web Archives’ Holdings