Provedeno jedanaesto harvestiranje nacionalne domene

7. 1. 2022.

Srce je u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu u razdoblju od 23. prosinca 2021. do 5. siječnja 2022. provelo jedanaesto harvestiranje hrvatskog weba. Prikupljeni su i pohranjeni javno dostupni sadržaji svih mrežnih sjedišta na vršnoj .hr domeni, uključujući from.hr i .com.hr. 

Uspješno je odrađeno 180.110.421 upita i harvestiranjem preuzeto 26,2 TB sadržaja spremljenog u format WARC. WARC datoteke komprimirane su te zauzimaju 12,2 TB diskovnoga prostora.

Korišten je popis od 117.770 aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici u Zagrebu dostavila CARNET-ova DNS služba, a pobiranje je provedeno pomoću alata otvorenoga koda Heritrix. Robot koji je provodio harvestiranje dolazio je sa servera u Srcu s adresom 161.53.3.11 i predstavljao se kao Mozilla/5.0 (compatible; heritrix/3.4.x; + https://haw.nsk.hr/cesta-pitanja/).

Sadržaj jedanaestog harvestiranja .hr domene bit će do kraja siječnja dostupna na stranici Hrvatskoga arhiva weba, na kojoj će se moći pregledavati sadržaji pohranjeni u prethodnih deset harvestiranja, tematska harvestiranja, zavičajne zbirke kao i sadržaji prikupljeni selektivnim pobiranjima.

Hrvatski arhiv weba


Izdvojena događanja Srca

velj 09

Student ste i želite se upoznati s osnovama HTML-a – tehnologije za izradu web-stranica? Prijavite se na besplatan tečaj koji se održava u okviru obrazovne akcije namijenjene studentima, pod nazivom "50 tečajeva za studente za 50 godina Srca". Tečaj će se održati u online okruženju i uz vodstvo predavača, a započet će u srijedu, 9. veljače 2022. u 9 sati. Prijave su u tijeku.

Ožu 07

Sveučilišni računski centar i ove će se godine uključiti u obilježavanje međunarodnog Tjedna otvorenog obrazovanja koji će se održati od 7. do 11. ožujka 2022.

tra 06

Srce 6. i 7. travnja organizira stručnu konferenciju Srce DEI 2022, ujedno i konferenciju nacionalnog strateškog projekta HR-ZOO.