Il miracolo della scansione

Per creare un archivio digitale è necessario innanzitutto individuare e stimare la grandezza dell’archivio cartaceo e conseguentemente fare la scelta di un hardware adatto (mezzo tecnico) che ne permetta la trasformazione in formato computerizzato. In questo articolo vedremo dei principi di base e un esempio numerico che tratta proprio di una parte dell’intero processo di digitalizzazione che sta interessando la rivista La sapienza della Croce.

Mi sembra logico supporre che tanti dei nostri lettori abbiano avuto a che fare, almeno una volta nella vita, con quel dispositivo elettronico chiamato scanner. Per tanti non addetti ai lavori è logico ricordare che gli scanner sono sempre esistiti fin dal tempo delle prime fotocopiatrici: la luce verde (o bianca) che illumina il foglio di cui dobbiamo fare la copia cartacea è tecnicamente uno scanner, che nella sua etimologia significa proprio esaminare.

Consultando il web poi si hanno definizioni di questo tipo: periferica esterna di input, operante in modalità unica o integrata in una stampante (multifunzione), in grado di acquisire in modalità ottica una superficie piana (fogli stampati, pagine di libri e riviste, fotografie, diapositive, ecc.), e di interpretarla come un insieme di pixel e, quindi, di restituirne la copia fotografica sotto forma di immagine digitale.

Detto in parole semplici la scansione permette che l’inchiostro nero (oppure i colori) del foglio vengano trasformati in una serie di cifre digitali, rappresentati nel computer da una lunga fila di 0 e 1 (bit), che possono essere memorizzati su un supporto informatico. Per ricostruire poi l’immagine originale sul monitor, al computer basta riprendere la lunga fila di bit e accendere (spegnere/colorare) i corrispondenti pixel.

Risulta interessante vedere come tutti questi concetti siano confrontabili con una situazione reale. La rivista La sapienza della croce ha iniziato la sua diffusione online in maniera sperimentale a partire dal 2000, quando in un sito interno alla congregazione passionista, si “mettevano in linea” i primi file PDF (portable document format), ossia si metteva a disposizione la copia digitale per i redattori e gli articolisti al fine di verificare l’impaginazione del lavoro fatto e la correzione delle bozze, resa scaricabile e visualizzabile tramite un link internet.

Precedentemente al 2000 è stato praticamente impossibile trovare materiale digitale, e quello che rimane a tutt’ora di quel tempo è un nutrito archivio storico cartaceo. Facendo dei rapidi conti, quando i componenti de La Sapienza della Croce (e della Cattedra Gloria Crucis) nel 2016 hanno deciso di dare il via alla digitalizzazione di tale archivio, si è calcolato che c’erano circa 15.000 pagine di materiale (non più consultato da anni, perché non più pubblicizzato, né facilmente consultabile al grande pubblico) che giacevano pressoché impolverate nel magazzino. Copie cartacee di annate (a volte fatte in abbondanza, a volte addirittura assenti) che erano rimaste lì in attesa di lettori.

Ed è qui dunque che si innesta il lavoro del nostro amico scanner. Chi ha fatto almeno una volta nella sua vita un lavoro di fotocopiatura e di catalogazione comprende quanto lungo e tedioso si prospettava il lavoro se la scansione delle varie annate della rivista fosse stata fatta in modo manuale, girando pagina per pagina, fascicolo per fascicolo. Fortunatamente la tecnologia da vari anni prevede che il lavoro in serie sia pressoché automatizzato attraverso un accessorio chiamato alimentatore automatico di fogli, oramai divenuto standard anche su macchine poco costose.

Questo dispositivo permette (come nella spedizione di fax con più di 1 pagina) di introdurre più fogli sciolti contemporaneamente (cioè non rilegati a colla, né pinzati tra loro) ed alimentare così lo scanner in maniera autonoma, pagina dopo pagina (anche in modalità fronte retro), senza interruzioni, senza dover mettere manualmente ciascuna pagina di volta in volta, abbassando e rialzando il dispositivo sopra il vetro di esposizione.

Per dare qualche numero una macchina dal costo di 1000 euro è capace di scansionare in bianco nero circa 30 pagine al minuto, rendendo così trasformabile l’archivio cartaceo trentennale di 15000 pagine, in un tempo di (soli) 500 minuti, ossia poco più di 10 ore macchina. In realtà occorre circa un mese di lavoro per l’operatore, necessitanti per la predisposizione dei fogli (i fascicoli delle riviste devono essere “amputati” del dorso per essere riportati allo stato di fogli sciolti, tramite una rifilatura che può essere economicamente fatta in tipografia) e per l’invio dei comandi allo scanner e l’organizzazione in cartelle dei digitali prodotti dal computer.

Vedremo nel prossimo articolo come sia importante (per questa fase) impostare correttamente nei parametri dello scanner il valore della risoluzione di scansione (indicata in punti per pollici, o dpi, dots per inch), per ottenere immagini digitali con un gran numero di pixel al fine di aver un miglior risultato per il successivo processo di riconoscimento dei caratteri.

Marco Staffolani
Amministratore Web
www.lasapienzadellacroce.mapraes.org