Provedeno šesto harvestiranje hrvatskog weba

5. 1. 2017.

Srce je u suradnji s Nacionalnom i sveučilišnom knjižnicom u Zagrebu provelo šesto harvestiranje hrvatskog weba. Harvestiranje je provedeno u vremenu od 25. prosinca 2016. do 2. siječnja 2017. Prikupljeni su i arhivirani javno dostupni sadržaji svih web sjedišta na vršnoj .hr domeni uključujući from.hr i .com.hr.

Ukupno je prikupljeno i arhivirano u WARC formatu više od 77 milijuna datoteka ukupne veličine 7 TB. Kao ishodišna točka korišten je popis aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici dostavio Registar .hr domena. Harvestiranje je provedeno na računalnoj opremi Srca pomoću open source alata Heritrix dorađenog u Srcu. Robot koji je provodio harvestiranje predstavljao se kao: Mozilla/5.0 (compatible; heritrix/1.14.4; +http://haw.nsk.hr/faq).

Novost je da su se u 2016. godini počele koristiti domene s dijakritičkim znakovima (Internationalized Domain Names) pa će u budućnosti biti sve više webova na adresama poput http://šktigrići.hr/.


Izdvojena događanja Srca

stu 29

Jeste li znali da postoje alati koji vam mogu pomoći prilikom izrade i organizacije bibliografskih izvora i umetanja referenci u tekst? Da biste naučili raditi s njima, prijavite se na tečaj koji se održava u srijedu, 29. 11. 2017., u 9 sati.

stu 30

Želite li se upoznati s mogućnostima besplatnog programa Inkscape, namijenjenog za stvaranje i obradu vektorske grafike, prijavite se na radionicu se održava 30. 11. 2017. s početkom u 9 sati.