PROTIV ZABORAVA

Jeste li zavirili u Hrvatski arhiv weba?

25.10.2013 u 16:22

Bionic
Reading

Posjetite li stranice Nacionalne i sveučilišne knjižnice u Zagrebu, možete pristupiti Hrvatskom arhivu weba, koji predstavlja zbirku odabranih sadržaja preuzetih s interneta i pohranjenih na računalnom poslužitelju NSK

Hrvatski arhiv weba je namijenjen preuzimanju i trajnom čuvanju publikacija s interneta kao dijela hrvatske kulturne baštine.

Arhivirani sadržaji mogu se pretraživati preko naslova, URL-a, ključnih riječi ili predmetnih područja. Također, arhivirani sadržaj dostupan je i putem online kataloga NSK

Kako bi se upotpunila baza arhiviranih sadržaja, Hrvatski arhiv weba je 2011. i 2012. godine proveo dva pobiranja (harvestiranja) hrvatske internetske domene, a u planu je i harvestiranje .hr domene u 2013. godini.

Rezultati pobiranja sada su dostupni putem web-stranica Hrvatskog arhiva weba i mogu se pretraživati tako da se u tražilicu unese točan URL i na kalendaru odabere željeni datum arhiviranog primjerka.

Do sada je provedeno i pet tematskih pobiranja sadržaja koji se odnose na specifičnu temu ili događaj kao što su lokalni izbori 2013, referendum o pristupanju Republike Hrvatske Europskoj uniji i slično. U popisu URL-ova, klikom na odabrani naslov prikazuje se arhivirane kopije web-stranice.

Do 2013. je arhivirano više od 4.900 naslova u preko 33.000 arhiviranih primjeraka. Ukupna veličina arhiviranog sadržaja je preko 13 TB. U Hrvatskom arhivu weba vjeruju kako će biti od velikog značaja studentima, povjesničarima i znanstvenicima, s ciljem otkrivanja, tumačenja i pojašnjavanja činjenica, stvaranja znanja o prošlim događajima, povijesti ili određenoj temi.

Alat za selektivno preuzimanje i arhiviranje digitalnog sadržaja razvijen je u Sveučilišnom računalnom centru (SRCE).

Za harvestiranja domene .hr i tematska harvestiranja koriste se alatom Heritrix. Heritrix je softver otvorenog koda čija je primarna svrha kvalitetno pobrati i sačuvati digitalne sadržaje s weba.

Od uspostave selektivnog sakupljanja web publikacija, planirana su i provedena godišnja harvestiranja domene kao i tematska harvestiranja te je u međuvremenu izrađena web stranica koja omogućava pregledavanje svih ovih sadržaja. Daljnji razvoj planiran je u skladu s daljnjim razvojem web tehnologija.