Provedeno šesto harvestiranje hrvatskog weba

5. 1. 2017.

Srce je u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu provelo šesto harvestiranje hrvatskog weba. Harvestiranje je provedeno u vremenu od 25. prosinca 2016. do 2. siječnja 2017. Prikupljeni su i arhivirani javno dostupni sadržaji svih web sjedišta na vršnoj .hr domeni uključujući from.hr i .com.hr.

Ukupno je prikupljeno i arhivirano u WARC formatu više od 77 milijuna datoteka ukupne veličine 7 TB. Kao ishodišna točka korišten je popis aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici dostavio Registar .hr domena. Harvestiranje je provedeno na računalnoj opremi Srca pomoću open source alata Heritrix dorađenog u Srcu. Robot koji je provodio harvestiranje predstavljao se kao: Mozilla/5.0 (compatible; heritrix/1.14.4; +http://haw.nsk.hr/faq).

Novost je da su se u 2016. godini počele koristiti domene s dijakritičkim znakovima (Internationalized Domain Names) pa će u budućnosti biti sve više webova na adresama poput http://šktigrići.hr/.


Izdvojena događanja Srca

sij 22

Želite li naučiti služiti se programom Access i kreirati baze podataka? Prijavite se na tečaj koji će započeti u ponedjeljak, 22. 1. 2018., u 9:00 sati. Prijave su u tijeku.

sij 23

23. i 24. siječnja održat će se tečaj na kojem nastavnici mogu naučiti osnove rada u sustavu za e-učenje Merlin.

sij 25

Želite li se upoznati s mogućnostima besplatnog programa Inkscape, namijenjenog za stvaranje i obradu vektorske grafike, prijavite se na radionicu se održava 25. 1. 2018. s početkom u 9 sati.