Petnaesto harvestiranje nacionalne domene

28. 11. 2025.

Kako bi se upotpunio opseg arhiviranih mrežnih publikacija, Nacionalna i sveučilišna knjižnica u Zagrebu (NSK) će u suradnji sa Srcem, petnaesti put pobirati (harvestirati) sadržaje objavljene na nacionalnoj domeni .hr u skladu s Pravilnikom o obveznome primjerku (NN 66/2020).

Suradnja NSK i Srca na razvoju zbirke Hrvatski arhiv weba traje od 2004. godine kada je pokrenuto prikupljanje obaveznog primjerka online publikacija prema Zakonu o knjižnicama i knjižničnoj djelatnosti (čl. 37-41).

Harvestiranje cijele domene podrazumijeva prikupljanje svih javno dostupnih sadržaja u zadanome vremenu na aktivnim domenama .hr, .com.hr i .from.hr.

Za harvestiranje će se koristiti popis od 138.796 aktivnih domena koji je NSK dostavio Registar .hr domena pri CARNET-u.

Očekuje se da će ove godine robot koji provodi harvestiranje prikupiti oko 17 TB sadržaja objavljenog na webu (web stranice, slike, dokumenti, video sadržaji,...) koliko je približno preuzeto s weba tijekom harvestiranja 2024. godine. Svi prikupljeni sadržaji bit će javno dostupni u sklopu stranica Hrvatskoga arhiva weba, a putem kojih su dostupna i sva prethodna harvestiranja.

Robot pobirač dolazi s IP adrese 161.53.3.11 i predstavlja se kao Mozilla/5.0 (compatible; heritrix/3.12.0; + https://haw.nsk.hr/cesta-pitanja).

Ako pobiranje utječe na vaše mrežne stranice, molimo javite se na @email i @email.