Dagli Usa al Regno Unito, le biblioteche archiviano il web

Mondo
La British Library di Londra inizierà ad archiviare 4,8 milioni di siti web, social network inclusi - Getty Images
british_library_getty

La British Library lancia un ambizioso progetto per conservare la memoria digitale di oltre 4,8 milioni di siti web, social network inclusi. Mentre la Library of Congress procede con il backup integrale di Twitter, in Italia non è attivo nessun progetto

di Nicola Bruno

Il rischio è di creare un "buco nero digitale" in cui scompaia gran parte della nostra memoria. Se è vero, infatti, che il patrimonio culturale non è fatto più solo di libri, dischi e film, ma anche di siti e risorse condivise sui social network, le principali biblioteche del mondo stanno iniziando ad attrezzarsi per archiviare ampie fette del web da rendere poi disponibile alle future generazioni.
Succede nel Regno Unito, dove dallo scorso 6 Aprile è entrata in vigore una legge sul deposito legale che porterà alla conservazione di quasi 5 milioni di domini Internet. Ma anche negli Stati Uniti, dove da un paio d'anni la Library of Congress ha iniziato ad archiviare l'intero database di Twitter. Ancora poco o nulla si sta facendo, invece, in Italia, dove al momento c'è solo una sperimentazione sul deposito degli ebook, ma niente che riguardi le risorse condivise ogni giorno online.

Regno Unito - 4,8 milioni di siti web. E' il numero di siti web che la British Library intende archiviare di qui alla fine del 2013, insieme a decine di migliaia di articoli pubblicati su riviste elettroniche, ebook e altre risorse digitali. Si tratta senza dubbio di uno dei più grandi tentativi di conservazione della memoria digitale in corso, superiore anche a quello di Archive.org, istituzione no-profit statunitense che dal 1996 sta archiviando miliardi di pagine web. Il sistema messo a punto dalla British Library prevede non solo di salvare molte più informazioni (500 MB per sito) rispetto ad Archive.org (10 MB per sito), ma anche di farlo con una frequenza maggiore: circa 500 domini saranno infatti indicizzati ogni giorno; tra questi ci sono molti siti di informazione, ma anche servizi di social-networking come Twitter e YouTube. Il tutto sarà poi gestito dalle sei biblioteche che si occupano del deposito legale in Gran Bretagna. Come ha spiegato Lucie Burgess, responsabile delle strategie alla British Library, "oggi per capire il nostro paese bisogna guardare al web. Abbiamo già perso un sacco di materiali, soprattutto per gli attentanti del 2005 a Londra e la crisi finanziaria globale del 2008".

Guarda il video della British Library



Stati Uniti a tutto Twitter - Uno dei grandi problemi delle risorse digitali è proprio la loro estrema volatilità. Secondo uno studio condotto su alcuni grandi eventi di attualità come la Primavera Araba e la morte dei Michael Jackson, l'11% dei contenuti pubblicati sui social media tende a scomparire nel giro di un anno; la percentuale sale al 27% dopo due anni. Proprio per evitare che in futuro scompaiano del tutto le testimonianze di grandi eventi storici, la Library of Congress statunitense è impegnata da tre anni nello sforzo di archiviare tutti i tweet pubblicati online. Secondo l'ultimo aggiornamento, per il periodo 2006-2010 sono stati salvati dall'oblio 170 miliardi di micro-messaggi. In tutto ciò cresce anche il volume dei tweet da archiviare: se nel 2011 erano 140 milioni al giorno, a ottobre 2012 sono diventanti 500 milioni.

Italia ferma - Sul fronte della conservazione delle risorse online per ora in Italia non c'è nessun progetto in piedi. "Non abbiamo notizia di simili iniziative", confermano dall'Associazione Italiana Biblioteche (Aib). Nessuna istituzione, cioè, sta pensando di archiviare i contenuti dei siti web più importanti per poi renderli accessibili anche in futuro. L'unico progetto attivo, per il momento, riguarda la sperimentazione del deposito legale di riviste elettroniche, tesi di dottorato ed ebook. Come negli altri paesi, anche in Italia è infatti previsto che gli editori debbano inviare una copia di ogni pubblicazione alle Biblioteca Nazionale di Roma e di Firenze che si occupano, appunto, di gestire l'archivio nazionale. Dal 2010 è stata introdotta la possibilità di inviare anche testi digitali, come ebook e giornali elettronici. Tutto è nato dal progetto "Magazzini Digitali" promosso dalla Fondazione Rinascimento Digitale di Firenze, che dal 2006 lavora per mettere a punto standard e tecnologie per la conservazione di risorse "native digitali". Nel 2011 il Ministero per i Beni Culturali ha invitato gli editori ad aderire a questo progetto (sul sito depositolegale.it c'è l'elenco delle case editrici che hanno aderito). Ma per ora si tratta solo di una sperimentazione volontaria che sarà attiva fino al 2015. Dopo di che l'Italia dovrà dotarsi di una strategia più ampia che punti non solo a catalogare gli ebook, ma anche altre risorse native del web. Altrimenti il "buco nero digitale" del nostro paese diventerà sempre più grande.

Mondo: I più letti

[an error occurred while processing this directive]