Provedeno šesto harvestiranje hrvatskog weba

5. 1. 2017.

Srce je u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu provelo šesto harvestiranje hrvatskog weba. Harvestiranje je provedeno u vremenu od 25. prosinca 2016. do 2. siječnja 2017. Prikupljeni su i arhivirani javno dostupni sadržaji svih web sjedišta na vršnoj .hr domeni uključujući from.hr i .com.hr.

Ukupno je prikupljeno i arhivirano u WARC formatu više od 77 milijuna datoteka ukupne veličine 7 TB. Kao ishodišna točka korišten je popis aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici dostavio Registar .hr domena. Harvestiranje je provedeno na računalnoj opremi Srca pomoću open source alata Heritrix dorađenog u Srcu. Robot koji je provodio harvestiranje predstavljao se kao: Mozilla/5.0 (compatible; heritrix/1.14.4; +http://haw.nsk.hr/faq).

Novost je da su se u 2016. godini počele koristiti domene s dijakritičkim znakovima (Internationalized Domain Names) pa će u budućnosti biti sve više webova na adresama poput http://šktigrići.hr/.


Izdvojena događanja Srca

lip 27

Trebate li pomoć kod uporabe programa Word prilikom oblikovanja seminarskog ili nekog drugog rada tijekom studija? Prijavite se na besplatnu radionicu koja se održava u srijedu, 27. 6. 2018. od 16:30 sati. Prijave su u tijeku.

lip 29

Želite li se upoznati s mogućnostima besplatnog programa GIMP koji će vam biti od pomoći pri obradi slika ili drugih vrsta grafike, prijavite se na radionicu koja će se održati 29. 6. 2018. u 16:30 sati. Prijave su u tijeku!