Marcello Ranieri
|
«Nel rappresentare il mondo, al quale mi
sento esposto, come un labirinto, tento di
prenderne le distanze, di fare un passo
indietro, di guardarlo negli occhi come un
domatore guarda una bestia feroce. E
questo mondo così come lo percepisco, io lo
metto a confronto con un mondo
contrapposto ad esso e che io m'invento». |
È intelligenza artificiale o sono solo intelligenti artifici? Automobili guidate da altre macchine, sistemi esperti che diagnosticano patologie con lo stesso grado di affidabilità di un medico specialista, certo. Ma quando le macchine saranno in grado di pensare? Quando l'espressione "intelligenza artificiale" perderà lo statuto di slogan visionario? Yurji Castelfranchi e Oliviero Stock tirano le fila di decenni di studi, obiettivi e realizzazioni concrete di questo così prolifico (di aspettative, ma anche di eclatanti risultati) paradigma di ricerca e bisogna riconoscere che, dopo una serrata romanzesca appassionantissima storia di tali studi, riescono a dissipare ogni dubbio sull'utilità di questi e sulle loro ricadute nella nostra vita di ogni giorno.1 Resta però il problema che quei compiti che richiedono di mettere in gioco qualcosa di se stessi, del proprio vissuto, della sensibilità acquistata in anni di sofferti successi e dolorose delusioni, segnano un discrimine sostanziale tra l'artificiale e l'umano, risultando improponibili per gli automatismi della più sofisticata delle macchine. Non so se e quando queste barriere cesseranno di esistere e non è questa la sede per discuterlo, ma ho fatto cenno alla questione in quanto il legame tra questi studi e le pratiche di trattamento automatico (elettronico) di testi è da sempre molto stretto e in alcuni filoni della ricerca è inscindibile: Elisabetta Gola nella sua panoramica sullo stato dell'arte in Linguistica computazionale chiarisce innanzitutto che «Se le lingue naturali siano sistemi computabili e quindi gestibili in modo automatico da un elaboratore è un problema che, pur nelle sue diverse sfaccettature, accomuna gli studiosi di intelligenza artificiale […] e gli studiosi interessati a esplorare i meccanismi delle lingue attraverso gli strumenti della logica»;2 Christiane Fellbaume presentando il lessico computazionale Wordnet si augura che la sua creazione «will inspire further applications among linguists, psycholinguists and researchers in artificial intelligence and natural language processing»;3 Antonio Zampolli in La bella e la bestia dopo aver distinto HTP (spogli umanistici di testi) e NLP (elaborazione del linguaggio naturale) ne evidenzia i contatti e ribadisce la complementarità.4 Del resto la labilità di confini all'interno di attività che sfruttano strumenti di analisi automatica dei testi è sottolineata anche in opere più specifiche, concentrate su un tema preciso, come le concordanze delle poesie di Gozzano ad opera di Giuseppe Savoca, nella cui introduzione si legge «non si ha chiaro a sufficienza lo statuto della concordanza [le concordanze di cui si tratta sono quelle realizzate con mezzi elettronici, N.d.C.] in sé, nella sua duplice apertura verso la linguistica testuale e verso la critica letteraria».5
II. 'ingegneria al servizio della lingua (o viceversa?)
Ecco che quanto detto sopra sulla differenza tra il lavoro dell'uomo e le attività automatizzate ci torna utile per affermare, senza dover esagerare col buon senso, che anche negli studi umanistici è il connubio con la supervisione umana a rendere veramente utile l'apporto della tecnologia a qualsiasi analisi di testi che si valga di ausili automatici. Sempre il medesimo Savoca, infatti, ritiene che «La scelta di servire i poeti fornendo, con l'ausilio delle tecnologie e metodologie informatiche più avanzate, strumenti antichi come le concordanze non è dettata né da pigrizia ermeneutica (nel senso che ci si vorrebbe sottrarre al confronto critico con le opere) né da infatuazione per le enormi capacità catalogatorie del computer»6 e altrove precisa che gli strumenti automatici possono rendere un servizio ai poeti solo con l'essere «un modo creativo per entrare in relazione con la parola poetica».7
Sta di fatto, però, che l'impressione che si può ricevere a un primo approccio con la cosiddetta ingegneria del linguaggio è che siano le ragioni dell'ingegneria a prevalere (e in modo talvolta aberrante) su quelle della linguistica (e della critica). Che l'atteggiamento sia quello del "si fa quel che si riesce a fare". Tanto per ipotizzare brutalmente un nodo problematico: i compromessi a cui si scende nella costruzione di ontologie semantiche per uso informatico, per via dei quali si considerano le parole di una lingua i semplici veicoli di un concetto in quella lingua, indifferentemente e dal concetto e dalla lingua, contrastano con il dato reale, fondamentale in qualsiasi branca degli studi umanistici, che ogni parola ha una storia e una vita proprie, con sfumature di significato che sono sue e soltanto sue e che ne fanno un po' un concetto a sua volta, rendendo l'operazione del raccordo con i concetti ontologici un'operazione quanto mai difficoltosa, la cui teoria ha a sua volta dignità di scienza. La cosa, in sé, potrebbe lasciare il tempo che trova; ma ne potrebbero altresì conseguire problemi se ci portasse a perdere coscienza dell'infinita varietà di significati non immediatamente traducibili di cui si arricchiscono nel tempo le manifestazioni di una lingua storico-naturale.
Chiaramente rischi come questo non incoraggiano i profani o i neofiti a deporre ogni sospetto verso certa sperimentazione e a non estendere tali sospetti alla disciplina nel suo insieme.
III. Un annoso isolamento
Forse bastano queste prese di posizione implicite, senza la reale presenza di alcun atteggiamento scostante, a minare i deboli rapporti con gli studi di tipo più tradizionale, nei quali raramente si scorge un'effettiva consapevolezza delle potenzialità offerte dall'automazione. Fino alla scissione, del tutto indebita, tra settori di studio che per risolvere i medesimi problemi si servono oppure non si servono dei mezzi informatici.
Vige in effetti una vera e propria forma di incomunicabilità tra Linguistica computazionale e discipline tradizionali; già la lamentava nel 1977, a livello italiano, Zampolli nella prima delle ormai consuetudinarie uscite di «Dieci anni di Linguistica italiana», iniziativa della Società di Linguistica Italiana: egli elogiava l'Accademia della Crusca per aver dato l'esempio nel superare lo scetticismo, però rilevava con Giulio Lepschy che «questo settore è stato spesso considerato come "staccato dal corpo centrale della linguistica"».8 Tornava sulla questione, ancora pressoché irrisolta, la seconda emissione di tali preziosi bilanci in cui si osservava che l'affermazione di Lepschy «rimane ancora valida».9 Ed è nuovamente Zampolli, anni dopo, a sostenere che in Italia «l'Università ha infatti dimostrato di avere problemi nel dare spazio a questa materia, forse perché difficilmente classificabile».10 E Savoca precedentemente confermava: «In verità, in Italia, siamo ben lontani da quel 'fervore rinascimentale' di ricerche e pubblicazioni che caratterizza questo tipo di lessicografia testuale all'estero e soprattutto negli Stati Uniti».11 O ancora: «Ma, stranamente, almeno in Italia, l'avvento del computer non ha portato a una maggiore produzione di concordanze, di cui si sente un vivo bisogno».12
Del resto, la difficile storia della Linguistica computazionale si riflette fin nel nome: già definita "trattamento automatico di dati linguistici" e "linguistica quantitativa" da Zampolli,13 in studiosi di minore consapevolezza qualche volta è stata fatta coincidere con la Linguistica "statistica" o "distribuzionale" o "matematica" o con il Natural Language Processing tout court (del resto una sua importante porzione).
Nuovamente Zampolli, però, rivendica l'autonomia della Linguistica computazionale (e per sé la paternità dell'espressione "risorse linguistiche", indicante gli ormai indispensabili corpora di testi) e la definisce come «la disciplina che applica il calcolatore al trattamento dei dati linguistici per scopi di ricerca oppure per le realizzazioni di applicazioni pratiche» e «analizza le operazioni che il ricercatore o lo studioso compiono, per fornire loro metodi e tecnologie in grado di agevolare l'attività di ricerca».14
IV. Verso l'unità delle discipline, in nome della "descrizione"
E attualmente sono mutate le cose? C'è stato un avvicinamento costruttivo, fruttuoso e oculato tra quelli che a lungo sono stati mondi separati? Tra sperimentazione innovatrice e adozione delle nuove tecnologie da una parte, e attaccamento alla tradizione dall'altra? Questo è difficile capirlo, ma di certo si può dire che è mutata la Linguistica computazionale: se analizziamo l'ultima uscita dei bilanci decennali della SLI, dal contributo già citato di Elisabetta Gola,15 che è un quadro esauriente della situazione attuale, abbiamo, anche a colpo d'occhio, l'impressione di un'espansione dilagante degli studi e dei loro campi di applicazione. Gli sviluppi della ricerca, il raggiungimento di potenze di calcolo molto maggiori, il web e le sue conseguenze nella visibilità internazionale dei progetti di studio ma anche nella aumentata reperibilità di risorse linguistiche, hanno aperto scenari inaspettati. E poi, vengono inclusi nel resoconto traduzione automatica, pragmatica, interfacce uomo-macchina, tutte cose programmaticamente escluse da una trattazione dettagliata negli omologhi precedenti.
Ebbene è proprio in questa nuova varietà che emerge secondo me con più evidenza la fondamentale originaria unità, sia tra le diverse branche specialistiche, sia tra ciò che esse vanno a comporre, la disciplina tutta della Linguistica computazionale e gli studi umanistici di natura tradizionale. È dal disorientamento che si potrebbe avere di fronte a una tale varietà che si è guidati nello sforzo di risalire a monte di essa a scoprire che cosa accomuna tanti rami di ricerca solo apparentemente slegati.
Infatti, scorrendo tutto il contributo di Elisabetta Gola, in cui un panorama così vasto viene tanto chiaramente presentato, si noterà bene come, in ognuno dei campi presi in analisi, il problema di base col quale ci si deve cimentare è e resta, costantemente, trasversalmente ai diversi settori, anche i più disparati, quello precipuo di "descrivere", di indicare con identificatori univoci (quelli che in informatica si chiamano puntatori). Sembra che l'obiettivo sia sempre lo stesso: descrivere. Qualunque cosa, pur se per gli scopi più diversi, anche ciò che intuitivamente non sembrerebbe suscettibile di descrizione. Gli stessi studi sugli studi, sullo stato dell'arte, suggeriscono sullo sfondo questa condivisione di strumenti (e una almeno parziale comunanza di obiettivi), le tecnologie come linguaggio per rappresentare il reale e trasmettere le informazioni ad esso relative; e poi questa impressione di massima ci viene ampiamente confermata ad ogni pié sospinto dalla letteratura specializzata.16
V. La ricerca sulla ricerca: prospettive e limiti
Descrivere, meglio o diversamente, ma per ottenere cosa? Il bello è proprio che, anche se a volte è il mezzo a condizionare i risultati, impostare la ricerca costringe a una rinnovata riflessione sulla ricerca stessa, e ci si deve chiedere cosa si vuole. «[…] una sfida che una volta accettata obbliga lo studioso a giocare con regole ben determinate e quindi a vedere l'oggetto di studio sotto una nuova e particolare prospettiva».17 Tullio De Mauro, sulla relazione tra informatica e linguaggio, soffermandosi a sua volta sulla formalizzabilità del linguaggio: «L'informatica ci sta permettendo di sottrarre la discussione ai rischi di una contrapposizione puramente teorica di argomenti e controargomenti».18 Savoca conferma: «non c'è tuttavia motivo di illudersi che l'uso del computer, allo stato, possa fare miracoli… Il calcolatore garantisce una totale precisione se gli si immettono dati corretti e se si eseguono correttamente i programmi previsti, ma le scelte di fondo e il controllo minuzioso di tutto ricadono sempre sotto la responsabilità dello studioso».19
La grande sfida in questa costante ricerca di formalismi descrittivi per qualsiasi aspetto del reale rimane quella di trovare sistemi formali per una rappresentazione univoca, computabile, non dei singoli oggetti o testi, ma della conoscenza e del linguaggio stesso: in questa direzione, ad esempio, la creazione del lessico Wordnet,20 e dei suoi arricchimenti Eurowordnet21 e Multiwordnet.22 E il grande problema, intimamente connesso a questa sfida, è quello della disambiguazione del linguaggio naturale: Elisabetta Gola a questo proposito ricorda che «non tutto è per ora automatizzabile: molte idiosincrasie delle lingue ancora sfuggono alle analisi computazionali. Per esempio non è possibile distinguere un modo di dire da una frase proposizionale qualunque, non è possibile distinguere un uso letterale da uno metaforico, non è possibile - per quanto riguarda l'ambito sintattico, generalmente più gestibile dai sistemi automatici - assegnare con sicurezza le funzioni grammaticali ai diversi argomenti di un verbo e non si può evincere la funzione degli argomenti non diretti»;23 molto trattato, ed emblematico, il problema della metafora.24
L'espansione dei linguaggi possibili traspone insomma su altri piani, in nuovi linguaggi, l'esigenza alla base della comunicazione: conoscere come descrivere, rappresentare, e descrivere per poter raccontare, riprodurre. Solo che noi raccontiamo con una passione che non sanno metterci le macchine; è quel quid che manca alle descrizioni che si è riusciti finora a ottenere dalle macchine, quella componente essenziale di umanità che tocca aggiungere a noi, si tratti di interpretare il numero di occorrenze di un termine in un testo letterario, o di assistere una traduzione automatica.
Finché non insegniamo alle macchine a pensare, continueremo a perfezionare ed espandere le descrizioni sempre di più per ottenere la migliore e più efficace fedeltà possibile alla realtà, ma il rischio è quello di volersi spingere fino a descrivere l'indescrivibile, fino al paradosso carrolliano della carta geografica grande come il mondo, per rappresentare attraverso il rappresentato stesso25 in una descrizione della descrizione, una «isomorfa trasformazione […] rappresentazione come oggetto euristico dal valore non assoluto».26
Bollettino '900 - Electronic Newsletter of '900 Italian Literature - © 2003-2004
Dicembre 2003, n. 2