Provedeno jedanaesto harvestiranje nacionalne domene

7. 1. 2022.

Srce je u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu u razdoblju od 23. prosinca 2021. do 5. siječnja 2022. provelo jedanaesto harvestiranje hrvatskog weba. Prikupljeni su i pohranjeni javno dostupni sadržaji svih mrežnih sjedišta na vršnoj .hr domeni, uključujući from.hr i .com.hr. 

Uspješno je odrađeno 180.110.421 upita i harvestiranjem preuzeto 26,2 TB sadržaja spremljenog u format WARC. WARC datoteke komprimirane su te zauzimaju 12,2 TB diskovnoga prostora.

Korišten je popis od 117.770 aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici u Zagrebu dostavila CARNET-ova DNS služba, a pobiranje je provedeno pomoću alata otvorenoga koda Heritrix. Robot koji je provodio harvestiranje dolazio je sa servera u Srcu s adresom 161.53.3.11 i predstavljao se kao Mozilla/5.0 (compatible; heritrix/3.4.x; + https://haw.nsk.hr/cesta-pitanja/).

Sadržaj jedanaestog harvestiranja .hr domene bit će do kraja siječnja dostupna na stranici Hrvatskoga arhiva weba, na kojoj će se moći pregledavati sadržaji pohranjeni u prethodnih deset harvestiranja, tematska harvestiranja, zavičajne zbirke kao i sadržaji prikupljeni selektivnim pobiranjima.

Hrvatski arhiv weba


Izdvojena događanja Srca

pro 12

U anketi koju je Sektor za napredno računanje proveo među korisnicima, znanstveni softver Mathematica je jedan od najpopularnijih izbora pa zbog toga Wolfram Mathematica i Srce za sve zainteresirane organiziraju trodnevnu online radionicu o korištenju ovog znanstvenog softvera. Broj prisutnih na radionici je ograničen.