Fabio Ciotti
Tecnologia e trasmissione del sapere: verso la biblioteca digitale


Sommario
I. Introduzione
II. L'automazione della biblioteca
III. Un nuovo paradigma: la biblioteca digitale
IV. Le sperimentazioni in corso: una breve rassegna
V. L'idea di «biblioteca digitale»
VI. Verso una formalizzazione della nozione di biblioteca digitale
VII. Struttura e requisiti di un «sistema di biblioteca digitale»
VIII. Il sistema di archiviazione dei documenti
IX. Il sistema di attribuzione gestione e ricerca dei metadati
X. I sistemi di accesso ai documenti
XI. Conclusioni
XII. Bibliografia


§ II. L'automazione della biblioteca

I. Introduzione

L'evoluzione antropologica e culturale dell'uomo è stata profondamente influenzata dalle tecnologie di elaborazione, conservazione, trasmissione ed accesso all'informazione.

Se facciamo astrazione dallo sviluppo del linguaggio verbale (che non può dirsi propriamente "invenzione"), questo processo secolare prende il via con l'invenzione della scrittura. La scrittura, infatti, fornì un supporto esterno e stabile nel tempo e nello spazio, alla facoltà di elaborazione simbolica dell'uomo; ciò rese possibile astrarre la conoscenza dal singolo individuo che la elaborava e che era deputato eventualmente a conservarla e diffonderla.

La seconda tappa di questo processo avviene con il perfezionamento, da parte dei greci, della scrittura alfabetica. Inizia allora il processo di testualizzazione della cultura e del sapere che ha caratterizzato la civiltà occidentale, processo che ha attirato l'attenzione degli "intellettuali" (ovvero gli elaboratori del sapere) sin da Platone. Da quel momento, l'elaborazione della conoscenza è andata progressivamente a coincidere con l'elaborazione di testi. E di conseguenza, si è stabilito uno stretto rapporto tra tale elaborazione intellettuale e la produzione, diffusione sociale e conservazione dei dispositivi materiali usati per fissare i testi, i documenti.

In particolare, ben presto emerge la preoccupazione di conservare i documenti del sapere, al fine di garantirne la permanenza e l'accessibilità nel tempo e nello spazio. Sebbene sia necessario adottare una grande cautela nell'estendere al passato nozioni ed istituti della nostra cultura, l'idea di un luogo istituzionale deputato alla conservazione dei documenti testuali, ciò che oggi chiamiamo "biblioteca", fa la sua comparsa sin dagli albori della storia del libro (inteso nel senso più vasto e comprensivo del termine). Anzi, è interessante rilevare come quasi subito la biblioteca è stata concepita come un conservatorio universale del sapere, in cui fosse consentito a chiunque un immediato accesso alla conoscenza depositata nei documenti.1

Nel corso dei secoli, la biblioteca ha assunto una funzione culturale e sociale sempre più centrale, divenendo materializzazione della conoscenza e dunque patrimonio da difendere, distruggere, nascondere o rendere accessibile, secondo il variare del rapporto tra potere e sapere. Allo stesso tempo essa è stata oggetto di un processo evolutivo, sia per quanto attiene alla concezione del suo ruolo nel contesto della comunicazione sociale, sia nella definizione delle sue funzioni, sia infine nella progettazione concreta. Questa evoluzione, in gran parte, è stata determinata dalle trasformazioni delle tecnologie di produzione e riproduzione dei documenti alla cui conservazione e diffusione la biblioteca era deputata.

Questa breve premessa ci permette di collocare nella giusta prospettiva il tema del nostro intervento. Da alcuni decenni, infatti, si sta verificando una ennesima trasformazione nei mezzi di produzione, archiviazione e disseminazione del sapere. L'introduzione delle nuove tecnologie dell'informazione e della comunicazione sta profondamente ridefinendo sia gli oggetti (i documenti) che le modalità operative di tali pratiche sociali. Di conseguenza, natura e funzioni della biblioteca sono andate incontro ad un processo di ristrutturazione che si è articolato in due fasi.

In un primo momento l'innovazione ha investito le funzioni di servizio e di organizzazione del sistema biblioteca; ma, con i recenti esiti nel settore dei nuovi media, si è giunti ad una ridefinizione del concetto stesso di "biblioteca", e all'emergenza del paradigma della «biblioteca digitale».

 

§ III. Un nuovo paradigma: la biblioteca digitale § I. Introduzione

II. L'automazione digitale

La prima fase del processo di innovazione nel mondo delle biblioteche ha riguardato due aspetti in particolare:

  • l'automazione dei sistemi di organizzazione e reperimento dei documenti informativi, i cataloghi e strumenti annessi (thesauri, authority list, etc.);

  • l'automazione dei processi gestionali (gestione del personale, acquisizioni, etc.) e delle funzione di servizio all'utente (prestito, etc.).
  • Questa fase di innovazione, pur avendo avuto inizio intorno agli anni sessanta e settanta, ha avuto tempi di espletamento e di diffusione capillare assai differenziati. A tutt'oggi, solo in pochi casi l'automazione bibliotecaria è arrivata a pieno compimento, portando alla sostituzione totale dello schedario cartaceo con sistemi informatici. E peraltro si rileva una notevole sperequazione nell'adozione di sistemi informatici nelle biblioteche sia a livello internazionale (dove gli Stati Uniti sono all'avanguardia) sia all'interno degli ambiti nazionali.

    L'automazione dei sistemi catalografici, si è incontrata ben presto con lo sviluppo delle tecnologie telematiche, ed in particolare con la diffusione della rete Internet nell'ambito del circuito accademico (soprattutto in area nordamericana). Il passaggio dal catalogo informatizzato al catalogo on-line, infatti, ha comportato una evoluzione lineare, che si è verificata in un contesto già tecnologizzato e dunque non restio all'innovazione. Da questo incontro hanno avuto origine i sistemi On-line Public Access Catalog (OPAC), che oggi rappresentano una delle risorse più preziose nell'ambito variegato dell'offerta informativa sulla rete Internet.2

    Anche nel settore degli OPAC si è verificata una evoluzione tecnica nei sistemi di consultazione, che ha seguito, sebbene con un certo scarto, lo sviluppo delle interfacce di accesso alla rete Internet. In una prima fase gli OPAC sono stati accessibili mediante sistemi di emulazione terminale remoto (telnet o tn3270). In questo caso l'utente entra direttamente nell'ambiente operativo a linea di comando dell'host su cui risiede l'OPAC, ed interagisce con il software di consultazione della banca dati. Sebbene con il passare degli anni tali software abbiano acquisto interfacce sempre più orientate all'utente, è innegabile che questa modalità di interazione presenta una certa dose di difficoltà, sia perché ogni sistema ha una sua interfaccia proprietaria, sia perché va in controtendenza rispetto alla consuetudini ed alle aspettative di utilizzo generate dalle interfacce grafiche.

    L'introduzione di World Wide Web ha rappresentato una notevole innovazione sotto questo punto di vista. La disponibilità di un dispositivo di interfaccia grafica alle informazione distribuite in rete consente di costruire dei sistemi front-end di interrogazione di un database (catalografico e non solo, o meglio non principalmente) assai più amichevoli e semplici e, soprattutto, tendenzialmente uniformi. Attualmente la maggior parte delle biblioteche dotate di OPAC pubblici hanno adottato questo sistema di interrogazione, utilizzando dei gateway tra il sistema di database ed il server Web. In questo modo è possibile consultare le banche dati direttamente dalle pagine Web, attraverso moduli interattivi basati sui classici dispositivi grafici (caselle combinate, menu a scelta multipla, caselle di testo e pulsanti, attivati con il sistema point and click) con cui un utente medio ha già dimestichezza e la cui curva di apprendimento all'uso è decisamente bassa.

     

    § IV. Le sperimentazioni in corso: una breve rassegna § II. L'automazione digitale

    III. Un nuovo paradigma: la biblioteca digitale

    L'informatizzazione e le messa in rete dei cataloghi, pur avendo radicalmente trasformato le modalità di realizzazione delle funzioni del sistema biblioteca, non ha inciso sulla natura fondamentale della biblioteca stessa, in quanto luogo fisico di conservazione e distribuzione dei documenti testuali. La grande Bibliothèque Nationale di Parigi ne è in un certo senso la dimostrazione: la maggiore intensità di tecnologie si applica ad una sistema biblioteca che si presenta ancora come un imponente luogo fisico, in cui l'informatica diventa strumento di gestione e di supporto dei processi materiali del sistema biblioteca.

    A far emergere un paradigma affatto nuovo del sistema biblioteca sono intervenuti gli sviluppi delle tecnologie dell'informazione e della comunicazione negli ultimi dieci anni. In particolare, due sono i fattori che hanno fornito la maggiore spinta propulsiva in questa direzione.

    In primo luogo, l'estensione e la autonomizzazione del documento digitale. L'evoluzione tecnologica nel settore dei nuovi media ha infatti conferito ai supporti digitali lo status di possibili o probabili sostituti dei documenti informazionali tradizionali, sia nell'ambito della comunicazione linguistica (libro, nelle sue varie forme, rivista, giornale, rapporto, relazione, atto, certificato, etc.), sia in quello della comunicazione visiva (fotografia, pellicola, etc.) e sonora (cassetta, vinile). Il documento digitale, dunque ha assunto una funzione autonoma dalla sua (eventuale) fissazione su un supporto materiale.

    In secondo luogo, lo sviluppo e la diffusione delle tecnologie telematiche in generale, e della rete Internet in particolare. Questa diffusione sta trasformando radicalmente le modalità di distribuzione e di accesso alle informazioni, e sta determinando la progressiva digitalizzazione e "telematizzazione" della comunicazione scientifica che, specialmente in alcuni contesti disciplinari, si svolge ormai quasi completamente mediante pubblicazioni on-line su Internet.

    La convergenza tra diffusione del documento elettronico e sviluppo delle tecnologie di comunicazione telematica ha favorito la sperimentazione di nuove forme di archiviazione e diffusione del patrimonio testuale. In questo contesto si colloca l'emergenza del paradigma della biblioteca digitale.

     

    § V. L'idea di «biblioteca digitale» § III. Un nuovo paradigma: la biblioteca digitale

    IV. Le sperimentazioni in corso: una breve rassegna

    Le prime pionieristiche esperienze in questo campo sono quasi coeve alla nascita di Internet. Ma è soprattutto dall'inizio di questo decennio che si è assistito ad una notevole crescita delle sperimentazioni. Parte di tali sperimentazioni si collocano nell'ambito di alcuni grandi progetti di ricerca finanziati da enti pubblici in vari paesi.

    Per limitarci all iniziative di maggiore momento, ricordiamo la statunitense Digital Libraries Initiative (DLI), un programma nazionale di ricerca finanziato dai tre enti governativi NSF, DARPA e NASA,3 cui partecipano sei grandi università, con altrettanti progetti di implementazione e sperimentazione di tecnologie avanzate per la creazione di biblioteche digitali multimediali distribuite su rete geografica.4 Il programma britannico eLib5 che, pur avendo una portata più generale (riguarda infatti tutti gli aspetti dell'automazione in campo bibliotecario), ha finanziati vari progetti rientranti nell'ambito delle biblioteche digitali. Diversi progetti sono stati sostenuti anche dall'Unione Europea, nel contesto dei vari programmi di finanziamento relativi all'automazione bibliotecaria.

    Dal canto loro, anche alcune grandi biblioteche nazionali si sono attivate in questo senso. Probabilmente l'iniziativa più nota è quella dalla Bibliothèque Nationale de France, che ha avviato un progetto per l'archiviazione elettronica del suo patrimonio librario sin dal 1992. Obiettivo del progetto è la digitalizzazione di centomila testi e trecentomila immagini, che saranno consultabili sia tramite Internet sia mediante apposite stazioni di lavoro collocate nel nuovo edificio della biblioteca a Parigi.6 Un progetto simile è stato intrapreso dalla Library of Congress di Washington, dove peraltro sono in corso numerose iniziative relative alla standardizzazione dei formati di digitalizzazione dei documenti archivistici (in particolare il progetto Encoded Archival Description) e dei metadati documentali.7

    Accanto ai grandi progetti nazionali ed internazionali, si colloca una mole ormai ingente di esperienze locali. Molte di queste sperimentazioni nascono in ambito accademico (in particolare nell'area umanistica) e sono gestite da biblioteche universitarie o da centri di ricerca costituiti ad hoc. Di norma queste risorse sono il frutto di progetti di ricerca finanziati, che possono disporre di strumenti tecnologici e di competenze specifiche molto qualificate, a garanzia della qualità scientifica dei documenti digitalizzati. I fondi documentali costituiti in questa serie di iniziative rispondono a criteri (tematici, temporali, di genere, etc.) ben definiti e si configurano come l'equivalente digitale delle biblioteche speciale e di ricerca.

    Un posto di rilievo è rivestito dal prestigioso Oxford Text Archive, realizzato dallo Oxford University Computing Services. Si tratta di un ingente archivio di testi elettronici di ambito letterario e saggistico, in gran parte di area culturale anglosassone (ma non mancano testi latini, greci e in altre lingue nazionali tra cui l'italiano). Le risorse testuali dell'OTA sono create da studiosi e centri di ricerca di tutto il mondo. Per questo l'archivio contiene edizioni altamente qualificate dal punto di vista filologico, che rappresentano una importante risorsa di carattere scientifico, specialmente per la comunità umanistica.8

    Molto importante è anche il servizio online realizzato dall'Electronic Text Center che ha sede presso la University of Virginia. Esso ospita molte migliaia di testi in varie lingue, suddivisi in diverse collezioni. Tuttavia, solo alcune di queste collezioni sono liberamente consultabili al di fuori delle rete di campus: tra queste la Modern English Collection, con oltre 1500 documenti testuali, corredati da illustrazioni e immagini digitali di parte dei manoscritti; la Middle English Collection; la Special Collection, dedicata ad autori afro-americani; la raccolta British Poetry 1780-1910.9

    Simile per concezione e soluzioni tecnologiche è la Humanities Text Initiative della University of Michigan, che ospita una serie di progetti, tra i quali l'American Verse Project, costituito da testi della tradizione poetica statunitense antecedenti al 1920.10 Ed ancora ricordiamo lo Women Writers Project, realizzato presso la Brown University e recentemente immesso in rete in via sperimentale. Si tratta di un corpus on-line di testi della letteratura femminile inglese dal Trecento all'epoca vittoriana, che si segnala per le avanzate soluzioni tecnologiche adottate.

    In questa rassegna di sperimentazioni nel settore delle biblioteche digitali non vanno dimenticati i progetti sviluppati e curati da organizzazioni ed associazioni che si collocano nell'area del "volontariato telematico". Queste esperienze offrono documenti di natura e collocazione tematica eterogenea, che l'utente può prelevare liberamente. Si colloca in questa area il decano dei progetti di biblioteca digitale, il Project Gutenberg. Le sue origini, infatti, risalgono al 1971, quando Michael Hart digitò manualmente al suo terminale il testo della Dichiarazione di indipendenza degli Stati Uniti. Oggi l'archivio contiene migliaia di testi, soprattutto di area linguistica inglese. Sulla spinta del Gutenberg, sono nati una serie di progetti simili, dedicati ad altre lingua nazionali: il progetto Cervantes per la letteratura spagnola; il progetto Runeberg per le letterature scandinave; il Progetto Manuzio per testi in lingua italiana.11

    Le trascrizioni elettroniche contenute in questi archivi, non hanno un grado di affidabilità scientifica adeguato, e quasi mai offrono apparati di codifica digitale (che richiedono competenze specifiche e costi di realizzazione non indifferenti). D'altra parte, trattandosi di iniziative che si basano sullo sforzo volontario di moltissime persone, possono avere buoni ritmi di ampliamento dei fondi, e dunque mettono a disposizione di una utenza generale una notevole mole di materiali testuali che in alcuni contesti sarebbero difficilmente accessibili.

     

    § VI. Verso una formalizzazione della nozione di biblioteca digitale § IV. Le sperimentazioni in corso: una breve rassegna

    V. L'idea di «biblioteca digitale»

    Parallelamente alla proliferazione di iniziative cui abbiamo accennato, negli ultimi anni si avuta una crescente attenzione teorica e metodologica al tema delle biblioteche digitali, tanto da giustificare la sedimentazione di un dominio disciplinare autonomo. Alla costituzione di questo dominio hanno fornito importanti contributi vari settori della ricerca informatica e sui nuovi media, come l'area del text processing, dell'information retrieval e degli agenti software, della grafica computerizzata, della telematica e delle reti computer. Ma senza dubbio i contributi di maggiore rilievo sono venuti dalle ricerche sui sistemi informativi distribuiti e dalla teoria degli ipertesti, nel cui contesto si può rintracciare la genealogia stessa dell'idea di «biblioteca digitale».

    Come noto i primi spunti in questo campo precedono la nascita di Internet e persino lo sviluppo dei computer digitali. Ci riferiamo al classico articolo di Vannevar Bush How we may think dove il tecnologo americano immagina l'ormai celeberrimo Memex. Lo stesso Bush, introducendo la descrizione del suo ingegnoso sistema di ricerca e consultazione di documenti interrelati, lo definisce una «sorta di archivio e biblioteca privati»12.

    Una approssimazione maggiore all'idea di biblioteca digitale (sebbene il termine non compaia esplicitamente), si ritrova nel concetto di docuverso elaborato da Ted Nelson, cui dobbiamo anche la prima formulazione esplicita dell'idea di ipertesto digitale.13 Nelson, sin dai suoi scritti degli anni '60, descrive il suo sistema ipertestuale Xanadu come un archivio distribuito su rete di documenti individuali ed identificabili, dotato di un sistema di indirizzamento e di reperimento. Vanno poi ricordate le fondamentali ricerche e sperimentazioni condotte dal gruppo di studiosi della Brown University che, a cavallo tra la fine dello scorso decennio e l'inizio dell'attuale, lavorarono sul sistema ipermediale Intermedia.14 La convergenza teorica e tecnica tra biblioteche digitali e sistemi ipertestuali distribuiti trova infine pieno compimento con la nascita e lo sviluppo di World Wide Web. L'ambiente ipertestuale della rete Internet, infatti, ha fornito un ambiente ideale per la sperimentazione concreta e diffusa di tutta l'elaborazione teorica accumulata in questo settore negli anni passati.

    Tuttavia, se la teoria degli ipertesti distribuiti rappresenta un punto di riferimento centrale nella discussione relativa alla struttura ed alle funzioni di una biblioteca digitale, essa non consente di distinguere con sufficiente chiarezza tra l'idea generica di un sistema di pubblicazione elettronica di documenti, l'idea di ipertesto distribuito e una nozione più formale di biblioteca digitale. Partendo da questa insufficiente determinazione, potremmo annoverare tra le biblioteche digitali tanto una pubblicazione su supporto ottico di un insieme di testi, basata su un qualche sistema ipertestuale, quanto l'intero World Wide Web.

    In effetti, analizzando la letteratura ci accorgiamo che il suggestivo termine «biblioteca digitale» funziona da «termine ombrello» (per dirla con Eco) sotto il quale si riparano concezioni e conseguentemente applicazioni assai diverse.15 Ad esempio nei documenti di presentazione della Digital Library Initiative si legge:

    «Information sources accessed via the Internet are ingredients of a digital library. Today, the network connects some information sources that are a mixture of publicly available (with or without charge) information and private information shared by collaborators. They include reference volumes, books, journals, newspapers, national phone directories, sound and voice recordings, images, video clips, scientific data (raw data streams from instruments and processed information), and private information services such as stock market reports and private newsletters. These information sources, when connected electronically through a network, represent important components of an emerging, universally accessible, digital library».
    Questa definizione, alquanto vasta e sotto molti rispetti generica, non fornisce adeguati strumenti per discriminare tra una biblioteca digitale e qualsiasi insieme di informazioni su supporto digitale, alimenta miti e convinzioni alquanto confuse sulle funzioni e potenzialità delle biblioteche digitali, e soprattutto non permette di dedurre un insieme di requisiti che un sistema di biblioteca digitale dovrebbe soddisfare. Se il termine «biblioteca digitale» individua un'aerea specifica di applicazione, occorre precisare in che senso la determinazione di digitale si applica alla nozione di biblioteca; in che modo una biblioteca digitale si differenza da una tradizionale e in che modo invece ne eredita funzioni e caratteristiche; come, infine, sia possibile distinguerla da altri sistemi informativi distribuiti (come appunto il Web in generale).

     

    § VII. Struttura e requisiti di un «sistema di biblioteca digitale» § V. L'idea di «biblioteca digitale»

    VI. Verso una formalizzazione della nozione di biblioteca digitale

    Un ottimo punto di partenza per arrivare ad una più puntuale formalizzazione della nozione di biblioteca digitale può essere rintracciato nella seguente definizione, elaborata nel corso del Workshop on On-line Access to Digital Libraries organizzato dalla IBM nel maggio 1994:

    «A digital library is a machine readable representation of materials which might be found in a university library together with organizing information intended to help users find specific information. A digital library service is an assemblage of digital computing, storage, and communications machinery together with the software needed to reproduce, emulate, and extend the services provided by conventional libraries based on paper and other material means of collecting, storing, cataloging, finding, and disseminating information. A full service digital library must accomplish all essential services of traditional libraries and also exploit digital storage, searching, and communication».16
    Sulla scorta di questa definizione, possiamo distinguere tra la nozione astratta di «biblioteca digitale» e la nozione funzionale ed applicativa di «sistema di biblioteca digitale».

    La nozione astratta di biblioteca digitale concerne la rappresentazione digitale del contenuto informativo di una biblioteca e delle metainformazioni (o metadati, secondo la terminologia anglosassone) atte al reperimento di specifiche sezioni al suo interno. Tale contenuto ha la forma di un insieme di documenti dotato di un duplice livello di organizzazione.

    In primo luogo i documenti non sono unità indifferenziate, ma oggetti complessi dotati di una struttura interna che gioca un ruolo fondamentale ai fini del reperimento e della fruizione dell'informazione che veicolano. Come hanno rilevato Furuta17 e più recentemente Renear,18 questa struttura gioca un ruolo importante nella rappresentazione digitale di un singolo documento e di conseguenza in quelle di una biblioteca, che in prima istanza è una collezione di documenti:
    «Arguably, a digital library is, if not a collection of documents, at least a structure of "document-like" material. If this is so, then the investigation of documents - of their essential nature and composition - must be at the core of the digital libraries research agenda».19
    Un contributo molto importante per l'indagine sollecitata da Renear viene dalle ricerche nel campo dei cosiddetti «linguaggi di markup strutturati». In questo contesto, infatti, sebbene muovendo da presupposti ed interessi applicativi affatto diversi, è stata elaborata una teoria formale della struttura componenziale dei documenti e sono stati proposti rigorosi modelli sintattici delle relazioni tra elementi di un documento e tra insiemi di documenti, anche di tipo multimediale.20 La famiglia di applicazioni SGML, Hytime e i più recenti XML e XSL e linguaggi correlati, riposa su una vera e propria "ontologia applicata" dei documenti, che fornisce importanti contributi alla formalizzazione della nozione di astratta biblioteca digitale. Vedremo peraltro coma da quest'area provengano altre importanti indicazioni per lo sviluppo dei sistemi di biblioteca digitale.

    In secondo luogo, il contenuto informativo di una biblioteca si distingue da un generico insieme di documenti in quanto dotato di un'organizzazione complessiva dovuta ad un agente intenzionale distinto dai creatori dei singoli documenti in essa contenuti. Tale organizzazione si manifesta nella biblioteca tradizionale mediante la classificazione, la soggettazione e l'indicizzazione. Questi strumenti, infatti, costruiscono una rete virtuale di relazioni tematiche e concettuali tra i documenti presi come unità.

    La biblioteca digitale fornisce un'opportunità di notevole potenziamento della "funzione organizzativa" dell'agente bibliotecario (adottiamo questa circonlocuzione per evitare di confondere il ruolo bibliotecario con l'individuo bibliotecario). L'idea di rete di relazioni tematiche potenziali, infatti, si presta in modo diretto a diventare la semantica di un sistema ipertestuale sufficientemente complesso (ma di un grado di complessità superiore all'attuale architettura informativa del Web, ad esempio), in specie se questo si innesta su una collezione di documenti dotati di struttura interna esplicita, come evidenziato prima. Infatti in questo caso è possibile interconnettere non solo le unità documentali prese come tutto ma anche i componenti interni di ogni singolo documento.

    Alla luce di queste riflessioni definiamo «biblioteca digitale» una collezione di documenti digitali strutturati (sia prodotti mediante digitalizzazione di originali materiali, sia realizzati ex-novo), dotata di un'organizzazione complessiva coerente di natura semantica e tematica, che si manifesta mediante un insieme di relazioni interdocumentali e intradocumentali e mediante un adeguato apparato metainformativo.

    In questo senso possiamo distinguere una biblioteca digitale da un insieme non organizzato di informazioni assolutamente eterogenee come World Wide Web, ma anche da molti archivi testuali che attualmente sono disponibili su Internet e che si presentano come "depositi testuali" piuttosto che come vere e proprie biblioteche.

     

    § VIII. Il sistema di archiviazione dei documenti § VI. Verso una formalizzazione della nozione di biblioteca digitale

    VII. Struttura e requisiti di un «sistema di biblioteca digitale»

    La definizione che abbiamo proposto nel paragrafo precedente individua un modello strutturale astratto della biblioteca digitale. La nozione di «sistema di biblioteca digitale», invece, attiene alle risorse tecnologiche (risorse hardware, sistemi di rete, software di stoccaggio dei dati, interfacce utente e sistemi di information retrieval) necessarie ad implementare tale modello, e di conseguenze individua le funzioni ed i servizi che vengono messi a disposizione degli utenti. Non possiamo in questa sede analizzare le architetture informative che sono state proposti in sede teorica o adottate nelle varie sperimentazioni in corso. Ci soffermeremo piuttosto sull'aspetto funzionale.

    Un punto di partenza naturale per questa indagine è costituito dall'analisi dei servizi e delle funzioni svolte da una biblioteca convenzionale, che possiamo articolare nelle seguenti aree: acquisizione e certificazione dei documenti; conservazione dei documenti; analisi catalogazione e classificazione dei documenti; supporto al reperimento dei documenti; consultazione e distribuzione dei documenti all'utenza. Come suggeriscono Gladney et al.21, un sistema di biblioteca digitale deve fornire almeno gli stessi servizi funzionali di una biblioteca convenzionale (chiaramente modellizzati mediante processi computazionali). Resta da discutere se le modalità di implementazione di tali funzioni in ambiente digitale costituisca un salto evolutivo qualitativo o una evoluzione lineare che introduce solo progressi quantitativi (in efficienza velocità, semplicità, etc.). L'adesione all'una o all'altra tesi è materia di dibattito in cui non poco incidono punti di vista ideologici sugli effetti e sulle conseguenze della rivoluzione digitale. Quale che sia la posizione adottata, comunque, è innegabile che la somma di innovazioni "quantitative" ha un peso specifico notevole e configura un profondo mutamento nel rapporto tra utente e biblioteca. Questo è tanto più vero se si considera che ai servizi ed alle funzioni per così dire "tradizionali", possono essere affiancati nuovi servizi resi possibili dall'ambiente digitale, in particolare nell'area della multimedialità e della elaborazione ed analisi del contenuto dei documenti.

    Sulla base di queste riflessioni proponiamo di articolare la nozione generale di «sistema di biblioteca digitale» nel seguente insieme di sottosistemi:

    1) sistema di archiviazione dei documenti

    2) sistema di attribuzione gestione e ricerca dei metadati

    3) sistema di distribuzione remota dei documenti

    4) sistema di consultazione on-line dei documenti

    5) sistemi di ricerca avanzati su contenuto dei documenti

    Un sistema di biblioteca digitale completo e pienamente funzionale deve essere dotato di tutti i moduli elencati. Nei prossimi paragrafi vedremo quali requisiti dovrebbe presentare ognuno di questi sottosistemi, e quali problemi debbono essere affrontati e risolti nella loro implementazione.

     

    § IX. Il sistema di attribuzione gestione e ricerca dei metadati § VII. Struttura e requisiti di un «sistema di biblioteca digitale»

    VIII. Il sistema di archiviazione dei documenti

    Il sistema di archiviazione dei documenti costituisce il cuore della biblioteca digitale, così come il magazzino e le eventuali sale di esposizione con la loro organizzazione strutturale e funzionale, ed i processi di acquisizione lo sono per una biblioteca tradizionale.

    La costituzione dell'archivio deve chiaramente rispondere in primo luogo ai principi di organizzazione tematica e di genere che regolano la collezione di documenti digitali. Poiché gran parte di tali documenti sono attualmente disponibili su supporti materiali, l'adempimento di tale funzione richiede una fase di digitalizzazione di fonti materiali. La digitalizzazione non è solo un processo tecnico, ma anche un processo rappresentazionale, che richiede l'attenta analisi della struttura dei documenti di origine e l'individuazione dei sistemi di codifica adeguati alla modellizzazione formale di tale struttura.22

    Un altro aspetto di capitale importanza del sistema di archiviazione dei documenti, è quello della preservazione a lungo termine del patrimonio documentale:

    «The primary requirement for a digital research library (DRL) is that from the start it be committed to organizing, storing and providing electronic information for periods of time longer than human lives».23
    Se il problema della preservazione in una biblioteca convenzionale riguarda la conservazione di oggetti materiali deperibili (libri, periodici, incunaboli, manoscritti documenti d'archivio etc.) ed eventualmente il loro restauro, nella biblioteca digitale esso si articola su tre livelli: livello hardware, livello software e livello dei sistemi di codifica dei documenti. Come noto, la curva di invecchiamento delle tecnologie informatiche è assai rapida, ed impone il periodico aggiornamento di qualsiasi sistema informativo. Tuttavia, tale aggiornamento rende progressivamente inaccessibili le risorse informative generate mediante gli strumenti tecnologici divenuti obsoleti.

    Questo può portare ad una situazione che può sembrare paradossale. I libri a stampa hanno tranquillamente superato i cinquecento anni di vita mantenendo pressoché intatta la loro disponibilità alla lettura, e alcuni manoscritti risalgono ad oltre duemila anni fa. Un documento elettronico, che apparentemente sembra godere della massima «riproducibilità tecnica», rischia di divenire inutilizzabile nel giro di pochissimi anni.

    La preservazione a lungo termine dei documenti digitali, pertanto, richiede l'adozione di sistemi di rappresentazione ed archiviazione informatica dell'informazione standardizzati e tecnicamente portabili, come rileva Burnard:
    «Standardization of the way in which information is stored and represented (rather than processed) is the key to a number of closely related problems, all of central concern to users of modern Information Technology, be they academic or commercial. For creators of language resources in particular, it addresses the difficulty of ensuring that information is reusable; the difficulty of ensuring that information represented in different ways can be seamlessly integrated; and the difficulty of facilitating loss-free information interchange between the widest choice of different platforms, different application systems and different languages».24
    In un senso formale uno standard è un insieme di norme di progettazione e di uso relative ad una particolare tecnologia, che viene emesse da un ente istituzionale nazionale o internazionale.25 Naturalmente una comunità di utenti particolare, nazionale o internazionale, dotata di strutture organizzative più o meno formalizzate, può decidere di sviluppare o adottare norme comuni per la rappresentazione ed il trattamento dell'informazione, una sorta di standard informale ad uso interno.

    Naturalmente, affinché uno standard di rappresentazione dell'informazione sia effettivamente portabile deve essere dotato di alcune caratteristiche tecniche e informatiche:

  • indipendenza dall'hardware, ovvero da una particolare architettura elaborativa (processore), da un particolare supporto digitale (disco magnetico, disco ottico, etc.), o da un particolare dispositivo o sistema di output (video, stampa);

  • indipendenza dal software, sia sistemi operativi, sia applicazioni deputate alla creazione, analisi, manipolazione e visualizzazione di testi elettronici;

  • indipendenza logica da tipologie di elaborazione; questo requisito sotto molti aspetti dipende dal precedente, ma non è con esso coestensivo: esistono sistemi di codifica altamente portabili dal punto di vista puramente tecnico, ma orientati ad un'applicazione specifica (stampa, information retrieval, analisi morfosintattica, etc.), e dunque difficilmente riutilizzabili per altre finalità.

    Chiaramente l'adozione di uno standard di rappresentazione e codifica dei documenti deve anche rispettare le esigenze di plasticità rappresentazionale evidenziate sopra. Se si analizza lo spettro di formati di codifica correntemente adottati nelle sperimentazioni di biblioteche digitali, si riscontrano le seguenti tipologie:

  • codifiche "puro testo", basate su tavole di codifica ASCII IRV o ISO 8859 (in particolare, poiché le esperienze si concentrano tematicamente nell'area culturale occidentale, ISO 8859-1, meglio conosciuta come ISO Latin 1);

  • formati applicativi proprietari quali Postscript, Portable Document Format (PDF), Rich Text Format (RTF) o la vasta congerie di formati prodotti da applicazioni di word processing e di desktop publishing;

  • codifiche non proprietarie ma verticali come COCOA, o DBT;

  • markup HTML (usato in massima parte in funzione presentazionale e non strutturale);

  • markup dichiarativi basati sullo Standard Generalized Markup Language (SGML), tra cui si distinguono lo schema Text Encoding Initiative (o sue versioni semplificate ed adattate), lo schema Encoded Archival Description, lo schema Electronic Thesis and Dissertation (ETD DTD, usato nell'ambito di alcuni archivi di tesi realizzati presso varie università statunitensi).La presenza di schemi proprietari dimostra la scarsa attenzione dedicata al problema della preservazione, mentre l'adozione di codifiche di "puro testo" o di codifica HTML denota una altrettanta negligenza riguardo agli aspetti qualitativi e ontologici implicati dalla rappresentazione digitale dei documenti. Allo stato attuale, la tecnologia che meglio risponde a tutti le esigenze che abbiamo enunciato è senza dubbio lo Standard Generalized Markup Language, ed i formati ad esso correlati (in particolare HiTyme, che specifica una complessa ed evoluta architettura ipermediale).

    In effetti, tutti i progetti di banche dati testuali più avanzati (sia in ambito accademico sia bibliotecario) attualmente presenti su Internet sono orientati in questo senso. In particolare, nel mondo della ricerca umanistica ha assunto un notevole rilievo la Text Encoding Initiative,26 una vasta e complessa applicazione SGML progettata specificamente per la codifica di testi letterari e documenti storici e linguistici.

    Un limite alla diffusione di SGML è costituito dalla sua complessità e, problema non secondario, dagli ingenti costi di implementazione. Per questo, riveste un ruolo molto importante la recente formalizzazione di un sottoinsieme semplificato di SGML da parte del World Wide Web Consortium, denominato Extensible Markup Language (XML).27 XML costituisce il perno di una profonda innovazione dell'architettura Web. La necessità di elaborare un sistema di codifica sufficientemente efficiente da funzionare su un ambiente distribuito geografico come Internet ha indotto ad abbandonare alcuni dei caratteri più esoterici di SGML, mantenendone tuttavia i pregi e le funzionalità. Insieme a XML sono in corso di formalizzazione una famiglia di linguaggi correlati dedicati alla specificazione di collegamenti ipertestuali (Xlink e Xpointer), di insiemi di codifica universali (XML namespace) e di fogli di stile (Extensible Stylesheet Language), che si potranno rivelare di notevole utilità per gli sviluppi futuri del settore delle biblioteche digitali.

     

    § X. I sistemi di accesso ai documenti § VIII. Il sistema di archiviazione dei documenti

    IX. Il sistema di attribuzione gestione e ricerca dei metadati. L'ultimo cerchio: la narrazione lineare

    Il sistema di attribuzione gestione e ricerca dei metadati costituisce l'equivalente della catalogazione e soggettazione dei documenti nella biblioteca tradizionale. Con il termine metadati si indica infatti l'insieme di dati ed informazioni che descrivono una risorsa documentale digitalizzata, sotto qualche rispetto.

    Sebbene l'attribuzione dei metadati sia una delle caratteristiche specifiche che fanno di un insieme di documenti una biblioteca, e sebbene la gestione dei cataloghi sia stata una delle prime funzioni del sistema biblioteca tradizionale ad esser sottoposta ad informatizzazione, gran parte delle attuali sperimentazioni di biblioteche digitali hanno completamente tralasciato questo aspetto.

    Un adeguato sistema di gestione dei metadati invece costituisce un supporto insostituibile per fornire all'utente un efficiente servizio di supporto all'individuazione di documenti contenenti l'informazione cui è interessato. Una corretta documentazione del testo elettronico dovrebbe provvedere almeno le seguenti informazioni:

  • individuazione del documento elettronico attraverso le sue determinazioni bibliografiche: titolo, autore, luogo e data di edizione, etc.;

  • indicazione della fonte del testo per i documenti elettronici che sono prodotti mediante digitalizzazione di materiale preesistente;

  • documentazione accurata delle metodologie e dei modelli adottati nella rappresentazione della struttura del documento;

  • certificazione della originalità, autenticità e qualità del documento digitale in relazione a particolari contesti applicativi (ad esempio nel caso di trascrizioni di opere letterarie va specificato il livello di correttezza della trascrizione e la natura degli interventi di codifica strutturale adottai)

    Un requisito importante per un sistema di gestione di metadati per i documenti digitali è la capacità di interagire con i tradizionali sistemi catalografici e dunque di essere importabile all'interno di un tradizionale sistema OPAC.

    Il settore dei metadati ha attirato una notevole attenzione in anni recenti, che ha generato una serie di proposte e di modelli. Tre i vari sistemi elaborati, due ci sembrano di particolare interesse in questa sede: il TEI Header e il Resource Description Framework.

    TEI header è una applicazione SGML che fa parte dello schema di codifica elaborato dalla Text Encoding Initiative (TEI).28 Ogni documento codificato secondo questo schema, infatti, deve avere una dettagliata ed articolata intestazione, una sorta di frontespizio elettronico contenente una serie di informazioni relative al documento stesso ed alle sue caratteristiche, espresse in modo strutturato. Il TEI Header può essere adottato come sistema per la documentazione di risorse documentali digitali, e si presta abbastanza facilmente ad essere convertito in un record catalografico Unimarc.

    Resource Description Framework (RDF) è invece un progetto in corso di elaborazione in seno al World Wide Web Consortium. Si tratta di un metalinguaggio astratto che permette di definire un insieme di coppie "attributo/valore" che descrivono qualunque risorsa digitale in modo rigoroso e formale. Le specifiche di RDF si basano sulla sintassi XML (anche se non esiste alcun vincolo a questo riguardo). A differenza del TEI Header, RDF è pensato esplicitamente per formalizzare metadati in modo che siano direttamente trattabili da sistemi software senza alcun intervento umano, e dunque può esser visto coma una sorta di sistema di scambio di informazioni tra agenti software. Esso tuttavia si presta con estrema flessibilità alla descrizione di metadati bibliografici e soprattutto permette di implementare un sistema di certificazione di documenti digitali basato sulla crittografia a chiave doppia.

     

    § XI. Conclusioni § IX. Il sistema di attribuzione gestione e ricerca dei metadati. L'ultimo cerchio: la narrazione lineare

    X. I sistemi di accesso ai documenti

    I sistemi di accesso ai documenti costituiscono nel loro complesso l'interfaccia utente del sistema biblioteca digitale. In questo campo come è lecito aspettarsi non si è ancora affermata alcuna standardizzazione. In generale possiamo distinguere tre modalità con cui un utente può accedere ai documenti archiviati in una biblioteca digitale:

  • distribuzione remota di file contenenti documenti digitali in vari formati per la consultazione off-line, mediante tecnologie di trasferimento file (con protocollo FTP o HTTP), eventualmente con la mediazione di pagine Web che fungono da indice attivo e da guida all'accesso per gli utenti;

  • consultazione on-line di documenti in ambiente Web; i documenti vengono inviati in formato HTML all'user agent dell'utente, ma alla fonte possono essere archiviati in vari formati; in questo caso la versione HTML viene generata dinamicamente dal lato server prima di essere inviata mediante protocollo HTTP;

  • consultazione avanzata di documenti mediante dispositivi di information retrieval.

    In linea di principio sarebbe auspicabile che un sistema di biblioteca digitale presenti tutte e tre queste modalità di accesso. Tuttavia allo stato attuale l'unico esempio di biblioteca digitale che si muove in questa direzione è quella dell'Oxford Text Archive.

    Il sistema dell'OTA permette all'utente di effettuare una ricerca nel catalogo dell'archivio mediante una serie di chiavi tipizzate.

     

    Oxford Text Archive

     

    Una volta individuati i documenti desiderati, l'utente può decidere di effettuare il download dei file selezionati o di accedere ad una maschera di ricerca per termini che genera un elenco di concordanze in format Key Word In Context (KWIC), da cui poi è possibile accedere all'intero documento.

     

    Oxford Text Archive

     

    Molto più avanzato è il sistema di accesso e ricerca sviluppato dal Women Writers Project. Esso si basa su un sistema di archiviazione gestione e ricerca di basi dati documentali in formato SGML, in grado di generare in modo dinamico file HTML.29 Questa traduzione dinamica è imposta dall'attuale architettura del Web, e in un certo senso determina una perdita di informazione, che però viene sopperita dalla disponibilità di strumenti di ricerca avanzati che agiscono dal lato server, e che dunque possono sfruttare tutti i vantaggi offerti dai documenti strutturati. Da questo punto di vista l'introduzione di XML potrebbe rappresentare un decisivo passo in avanti, permettendo la distribuzione di documenti variamente codificati anche dal lato client.

    Grazie a quest'architettura soggiacente, il WWP fornisce un'interfaccia di ricerca sia sui metadati sia sul contenuto dei documenti molto avanzato. L'utente non solamente è in grado di scorrere il testo e di fare ricerche per termini, ma dispone di un vero e proprio ambiente di lavoro virtuale, con strumenti di ricerca contestuale. Ad esempio si possono fare ricerche specificando che il termine cercata debba apparire solo nei titoli di capitolo, o nell'ambito di un discorso diretto, o ancora nel contesto di espressioni in lingue diverse da quella principale del testo.

     

    Women Writers Project

     

    Una volta effettuata la ricerca, si ottiene un elenco attivo di concordanze in modalità KWIC, che permettono a loro volta di accedere ai singoli testi del corpus che contengono occorrenze dei termini ricercati.

     

    Women Writers Project

     

    Il sistema di biblioteca digitale del WWP mostra anche le possibilità aperte dalle funzionalità ipertestuali dell'ambiente Web. Ogni testo base è inserito in una rete di materiali contestuali di carattere saggistico e didattico. Naturalmente la centralità di un determinato documento è dinamica, e dunque un utente può decidere di adottare un proprio punto di vista circa il "centro" e la "periferia" della rete di relazioni. Questo ovviamente comporta una progettazione adeguata dei rapporti ipertestuali che sottostanno alle possibilità di lettura e soprattutto richiede di avere a disposizione un sistema ipertestuale evoluto che consenta la creazione di collegamenti "multidirezionali" e soprattutto di collegamenti categorizzati. Anche in questo ambito le innovazioni introdotte con la famiglia di standard XML potranno aprire delle notevoli prospettive nel prossimo futuro.

     

    § XII. Bibliografia § X. I sistemi di accesso ai documenti

    XI. Conclusioni

    Le biblioteche digitali rappresentano l'incarnazione contemporanea di un sogno che ha accompagnato la storia della nostra cultura: il sogno di una biblioteca universale, un archivio globale del sapere depositato in un rete di documenti, cui chiunque può accedere in modo immediato. Non stupisce dunque che la diffusione così rapida di un formidabile sistema di diffusione dell'informazione come Internet abbia non solo rinnovato tale sogno, ma anche stimolato la realizzazione delle prime sperimentazioni pratiche.

    Naturalmente il passaggio da sogno a progetto teorico e quello da progetto a implementazione sperimentale introduce modifiche e riformulazioni, spesso in senso limitativo. Se alcuni dei requisiti che abbiamo individuato possono sembrare sul piano teorico del tutto ragionevoli, se non scontati, lo studio delle esperienze in corso ci ha rivelato invece quanto poco siano tenuti in conto anche nei "progetti di punta" del settore. Non mancano certo sperimentazioni di alto livello; ma in generale molte funzionalità che un utente medio si aspetterebbe di trovare in una biblioteca digitale sono tenute in scarsa considerazione, se non del tutto neglette.

    In parte queste carenze sono determinate dalla scarsa maturità delle tecnologie di base e dalla attuale architettura del Web. Ma spesso sono dovute ad una carenza teorica e metodologica. Per questo siamo convinti che la realizzazione di una biblioteca digitale necessita di un'attenta progettazione, che tenga conto sia delle funzioni tradizionali del sistema biblioteca (e dei saperi in quel contesto elaborati), sia delle nuove funzionalità rese possibili dall'ambiente digitale. In tale progettazione debbono convergere competenze multidisciplinari, collocate sia sul versante tecnologico (software ed hardware) sia su quello della scienze del testo e della biblioteconomia.

    Ma le maggiori esperienze internazionali ci dimostrano anche un altro aspetto di cui occorre tenere conto. La creazione di archivi digitali del patrimonio testuale comporta la soluzione di problemi complessi. La gestione di processi di digitalizzazione che hanno costi ingenti, la garanzia di stabilità e di portabilità nel tempo e nello spazio del patrimonio culturale digitalizzato, la creazione o la scelta di standard adeguati. Questi problemi possono e debbono essere affrontati nel quadro di un intervento istituzionale che promuova progetti ed iniziative qualificate in questo settore tanto innovativo, quanto fondamentale per la costruzione di una società dell'informazione che non disperda l'eredità culturale del passato.

     

    § Torna al sommario dell'articolo § XI. Conclusioni

    XII. Bibliografia

    • Allen, Robert B. e Rasmussen, Edie (a cura di) - Proceedings of the 2nd ACM International Conference on Digital Libraries: ACM Digital Libraries '97, 1997.
    • Atkinson, Ross - Library Functions, Scholarly Communication, and the Foundation of the Digital Library: Laying Claim to the Control Zone, in «The Library Quarterly», luglio 1996, n. 66, pp. 239-265.
    • Basili, Carla - La biblioteca in rete, Milano, Editrice Bibliografica, 1998.
    • Bolter, J. David - Writing Space: The Computer, Hypertext, and the History of Writing, Lawrence Erlbaum Associates, 1991.
    • Bryan, Martin - SGML: An Author's Guide to the Standard Generalized Markup Language, Wokingham/Reading/New York, Addison-Wesley, 1998.
    • Burnard, Lou - Text Encoding for Information Interchange. An Introduction to the Text Encoding Initiative. TEI J31, Oxford, Oxford University Computing Services, 1995.
      <http://www.hcu.ox.ac.uk/TEI/Papers/J31/>.
    • Bush, Vannevar - As We May Think, in «Atlantic Monthly», luglio 1945. (Trad. it. in Nelson - Literary Machines 90.1 cit., 1992, pp. 1/38-1/53).
    • Buzzetti, Dino - Image Processing and the Study of Manuscript Textual Traditions, in «Historical Methods», 1995, n. 28, pp. 145-163.
    • Carpenter, Leona; Shaw, Simon e Prescott, Andrew (a cura di) - Towards the Digital Library: The British Library's Initiatives for Access Programme, Londra, The British Library, 1998.
    • Ciotti, Fabio - Il testo elettronico: memorizzazione, codifica e edizione informatica del testo, in «Macchine per leggere. Tradizioni e nuove tecnologie per comprendere i testi», Spoleto, Cisam-Fondazione E. Franceschini, 1994.
    • Ciotti, Fabio - Testi elettronici e biblioteche virtuali: problemi teorici e tecnologie, in «Schede Umanistiche», 1995 II, n. 2.
    • Ciotti, Fabio - Cosa è la codifica informatica dei testi?, in Gruber & Paoletto (a cura di) - Umanesimo e Informatica, Pesaro, Metauro edizioni, 1997.
    • Ciotti, Fabio - Testo rappresentazione e computer. Contributi per una teoria della codifica testuale, in Bellman, Nerozzi P. (a cura di) - Internet e le Muse, Milano, Mimesis, 1997.
    • Ciotti, Fabio - Text encoding as a theoretic language for literary text analysis, intervento al convegno «Literature, Philology And Computers. An international seminar», University of Edinburgh, School of European Languages and Cultures, 7-9 settembre 1998, in corso di pubblicazione.
    • Ciotti, Fabio - La comunicazione telematica e le comunità scientifiche, intervento al convegno «Le comunità virtuali e i saperi umanistici», IULM, Milano, 26-28 novembre 1997, in corso di pubblicazione.
    • Ciotti, Fabio et al. - Internet 98. Manuale per l'uso della rete, Roma-Bari, Laterza, 1998 .
    • Cole, Timothy W. e Kazmer, Michelle M. - SGML as a Component of the Digital Library «Library Hi Tech», 1995, n. 13, pp. 75-90.
    • Coombs, James H.; Allen H. Renear, Steven J. DeRose - Markup Systems and the Future of Scholarly Text Processing, in «Communications of the Association for Computing Machinery 30/11», 1987, pp. 933-947, ora in Landow e Delany (a cura di), The Digital Word cit., 1993, pp. 85-118.
    • De Rose, Steven J.; Durand, David; Mylonas, Elli e Renear, Allen H. - What is Text, Really?, in «Journal of Computing in Higher Education», 1990, n. 1/2, pp. 3-26.
    • Digital Libraries '94: Proceedings of the First Annual Conference on the Theory and Practice of Digital Libraries, College Station, Texas A&M University, 1994.
    • Digital Libraries '95: Proceeding of the Second Annual Conference on the Theory and Practice of Digital Libraries, College Station, Texas A&M University, 1995.
    • Digital Library Initiative, A joint initiative of the National Science Foundation, the Advanced Research Projects Agency, and the National Aeronautics and Space Administration, U.S. Government document, NSF, 1994.
    • Drabenstott, Karen M. - Analytical review of the library of the future, Washington, DC, Council Library Resources, 1994.
    • Fox. E. A. (a cura di) - Source Book on Digital Libraries, TR 93-35, Dept. of Computer Science, Virginia Tech, 1993.
      <ftp://fox.cs.vt.edu/pub/DigitalLibrary>.
    • Fox, Edward - Digital Libraries,in «IEEE Computer», 1993, 26(11), pp. 79-81.
    • Fox, Edward e Lunin, L. - Introduction and Overview to Perspectives on Digital Libraries in «Journal of the American Society for Information Science», 1993, 44(8), pp. 441-443.
    • Furuta, Richard - Documents in the Digital Library, in «Proceedings of the International Symposium on Digital Libraries 1995», Tsukuba, Ibaraki, Giappone, agosto 1995, pp. 105-111.
    • Gigliozzi, Giuseppe (a cura di) - Studi di codifica e trattamento automatico dei testi, Roma, Bulzoni, 1987.
    • Gigliozzi, Giuseppe - Codice, testo e interpretazione, in Gigliozzi, Giuseppe (a cura di) - Studi di codifica e trattamento automatico dei testi cit., 1987, pp. 65-84.
    • Gigliozzi, Giuseppe - Il testo e il computer. Manuale di informatica per gli studi letterari, Milano, Bruno Mondadori, 1997.
    • Gladney, Henry M. et al. - Digital Library: Gross Structure and Requirements (Report from a Workshop), IBM Research Report RJ 9840, 1994.
      <http://www.ifla.org/documents/libraries/net/rj9840.pdf>.
    • Goldfarb, Charles F. - The SGML Handbook, Oxford, Oxford University Press, 1990.
    • Graham, Peter - Requirements for the Digital Research Library, in «College and Research Libraries», giugno 1995, pp. 331-339.
      <http://www.ifla.org/documents/libraries/net/drc.htm>.
    • Griffin, Stephen M. - NSF/DARPA/NASA Digital Libraries Initiative: A Program Manager's Perspective, in «D-LIB Magazine», luglio/agosto 1998.
    • Herwijnen, Eric van - Practical SGML, Boston/Dordrecht/London, Kluwer Academic Publishers [ 2ª ed.], 1994.
    • Huitfeldt, Claus - Multi-Dimensional Texts in a One-Dimensional Medium, in «Computers and the Humanities», 1995, vol. 28, pp. 235-241, già in Henry, Paul e Utaker, Arild (a cura di), Wittgenstein and Contemporary Theories of Language, in «Working Papers from the Wittgenstein Archives at the University of Bergen», 1992, n. 5, pp. 142-161.
    • Ide, Nancy e Sperberg-McQueen, C. Michael - The Text Encoding Initiative: Its History, Goals and Future Development, in Ide e Véronis (a cura di) - The Text Encoding Initiative cit., 1995, pp. 5-16.
    • Ide, Nancy e Véronis, Jean, (a cura di) - The Text Encoding Initiative: Background and Context, Dordrecht, Netherlands, Kluwer Academic Publishers, ristampa di Computers and the Humanities, 1995, 29, n. 1, 2, 3.
    • IEEE International Forum on Research and Technology Advances in Digital Libraries: ADL '97, Washington, D.C. Los Alamitos, CA: IEEE Computer Society Press, 1997.
    • ISO (International Organization for Standardization) - ISO 8879:1986(E). Information processing - Text and Office Systems - Standard Generalized Markup Language (SGML), Ginevra, International Organization for Standardization, 1986.
    • ISO (International Organization for Standardization) - ISO/IEC 10744-1992 (E). Information technology - Hypermedia/Time-based Structuring Language (HyTime), Ginevra, International Organization for Standardization, 1992.
    • Kilker, Julian e Gay, Gery - The Social Construction of a Digital Library: A Case Study Examining Implications for Evaluation, in «Information Technology and Libraries», giugno 1998, n. 17, pp. 60-70.
    • Klemperer, Katharina e Chapman, Stephen - Digital Libraries: A Selected Resource Guide, in «Information Technology and Libraries», settembre 1997, n.16, pp. 126-131.
    • Knuth, Donald E. - The TEXbook, Reading (Mass), Addison Wesley, 1984.
    • Landow, G. - Electronic Conferences and Samiszdat Textuality: The Example of Technoculture, in Landow, G. e Delany, P. (a cura di) - The Digital Word cit., 1993, pp. 237-249.
    • Landow, George P. e Delany, Paul (a cura di) - Hypermedia and Literary Studies, Cambridge/London, MIT Press, 1991.
    • Landow, George P. e Delany, Paul (a cura di) - The Digital Word: Text-Based Computing in the Humanities, Cambridge/London, MIT Press, 1993.
    • Landow, George P. e Delany, Paul - Managing the Digital Word: The Text in an Age of Electronic Reproduction, in Landow, G. e Delany, P. (a cura di) - The Digital Word cit., 1993, pp. 3-28.
    • Levy, David M. e Marshall, Catherine C. - Going Digital: A Look at Assumptions Underlying Digital Libraries, in «Communications of the ACM», aprile 1995, n.38, pp. 77-84.
    • Marchionini, Gary e Maurer, Hermann - The Roles of Digital Libraries in Teaching and Learning, in «Communications of the ACM», aprile 1995, n. 38, pp. 67-75.
    • Marcum, Deanna B. - Digital Libraries: For Whom? For What?, in «The Journal of Academic Librarianship», marzo 1997, n. 23, pp. 81-84.
    • Nelson, Ted - Literary Machines 90.1, Padova, Muzzio, 1992.
    • O'Donnell, James - Avatars of the Word: From Papyrus to Cyberspace, Cambridge, Harvard University Press, 1998.
    • Paepcke, Andreas; Chang, Chen-Chuan K.; Garcia-Molina, Hector; Winograd, Terry - Interoperability for Digital Libraries Worldwide, in «Communications of the ACM»; aprile 1998, n. 41, pp. 3-43.
    • Pichler, Alois - Advantages of a Machine-Readable Version of Wittgenstein's Nachlass, in Johannessen and Nordenstam (a cura di) - Culture and Value: Philosophy and the Cultural Sciences , The Austrian Ludwig Wittgenstein Society, 1995.
    • Pichler, Alois - Transcriptions, Texts and Interpretations, in Johannessen and Nordenstam (a cura di) - Culture and Value: Philosophy and the Cultural Sciences, The Austrian Ludwig Wittgenstein Society, 1995.
    • Practical Digital Libraries: Books, Bytes, and Bucks, San Francesco, Morgan Kaufmann Publishers, 1997.
    • Proceedings of International Symposium on Digital Libraries 1995, Tsukuba Science City, University of Library and Information Science, 1995.
    • Renear, Allen e Bilder, Geoffrey - Two thesis about the New Scholarly Communication, in Landow, G. e Delany, P. (a cura di) - The Digital Word cit., 1993, pp. 217-236.
    • Renear, Allen - Out of Praxis: Three (Meta)Theories of Textuality, in Sutherland (a cura di) - Elecronic Texts cit., 1997, pp. 107-126.
    • Renear, Allen - The Digital Library Research Agenda. What's Missing - and How Humanities Textbase Projects Can Help, in «D-Lib Magazine», luglio/agosto 1997.
    • Renear, Allen; Durand, David; Mylonas, Elli - Refining Our Notion of What Text Really Is: The Problem of Overlapping Hierarchies, in Ide e Hockey (a cura di) - Research in Humanities Computing, Oxford, Oxford University Press, 1995. Disponibile in versione preliminare su Internet all'indirizzo:
      <http://www.stg.brown.edu/resources/stg/monographs/ohco.html>.
    • Schatz, Bruce R. - Information Retrieval in Digital Libraries: Bringing Search to the Net, in «Science», gennaio 1997, n. 17, pp. 327-334.
    • Smith, Joan. M. - SGML and Related Standards. Document Description and Document Processing Languages, New York/London, Ellis Horwood, 1992.
    • Sperberg-McQueen, C. Michael - Text in the Electronic Age: Textual Study and Text Encoding, with Examples from Medieval Texts, in «Literary and Linguistic Computing, 6:1», 1991.
    • Sperberg-McQueen, C. Michael e Burnard, Lou (a cura di) - Guidelines for Electronic Text Encoding and Interchange (TEI P3), Chicago, ACH/ACL/ALLC (Association for Computers and the Humanities, Association for Computational Linguistics, Association for Literary and Linguistic Computing), 1994.
    • Sperberg-McQueen, C. Michael e Burnard, Lou - The Design of the TEI Encoding Scheme, in Ide e Véronis (a cura di) - The Text Encoding Initiative cit., 1995, pp. 17-38.
    • Sutherland, Kathryn - Elecronic Texts. Investigations in Method and Theory, Oxford, Clarendon Press, 1997.
    • Unicode Consortium - The Unicode Standard, Worldwide Character Encoding, Version 1.0, Volume 2, Reading (Mass), Addison-Wesley, 1992.
    • World Wide Web Consortium - Extensible Markup Language (XML) 1.0. W3C Recommendation, 1998.
      <http://www.w3.org/TR/1998/REC-xml-19980210>.
    • World Wide Web Consortium - Namespaces in XML. W3C Working Draft, 1998.
      < http://www.w3.org/TR/1998/WD-xml-names-19980916>.
    • World Wide Web Consortium - Resource Description Framework (RDF) Model and Syntax Specification. W3C Proposed Recommendation 05 January 1999, 1999.
      <http://www.w3.org/TR/PR-rdf-syntax>.
    • Yankelovich, Nicole - From Electronic Book to Electronic Libraries: Revisiting «Reading and Writing the Electronic Book», in Landow, George P. e Paul Delany (a cura di) - Hypermedia and Literary Studies cit., 1991.

    [Intervento tenuto al Convegno «Internet: Ricerca e/o Didattica», Bologna, Dipartimento di Italianistica, 27 novembre 1996; rivisto dall'autore nel 1999]

     

    Precedente Successivo Torna all'indice del numero Torna all'inizio dell'articolo


    Bollettino '900 - Electronic Newsletter of '900 Italian Literature - © 2000

    2000, n. 1-2