Home Misteri e curiosità Manoscritto Voynich vs Intelligenza Artificiale: il mistero permane

Manoscritto Voynich vs Intelligenza Artificiale: il mistero permane

3 Febbraio 2018

Da oltre 600 anni si cerca di sciogliere il mistero che avvolge il Manoscritto Voynich, testo apparentemente impossibile da tradurre. Il guanto di sfida, questa volta, è stato lanciato all’Intelligenza Artificiale (AI).

Se volessimo compilare una lista dei 100 oggetti più strani al mondo (solo le cose più bizzarre che la civiltà umana abbia partorito nel corso dei millenni) non potremo assolutamente trascurare il manoscritto Voynich.
Scritto 600 anni fa in una lingua che nessuno può leggere e pieno di diagrammi che nessuno capisce, è un autentico mistero di portata mondiale.
Questa è presumibilmente la ragione per cui quando, questa settimana, le redazioni di tutto il pianeta hanno avuto l’opportunità di pubblicare la notizia che il manoscritto era stato “decodificato dall’intelligenza artificiale”, hanno preferito desistere.

Infatti, non è così. Affatto. Secondo gli esperti, il manoscritto Voynich rimane imperscrutabile come sempre. Ma capire perché questa nuova metodica non sia riuscita a “tradurre” il testo e cosa, esattamente, aggiunge agli annali di “Voynichology”, ha il suo valore. Sottolinea anche (se fosse necessaria un’ulteriore enfasi) che questo manufatto è un cimelio estremamente strano.

La ricerca che ha suscitato tanto clamore è un documento intitolato “Decodifica di testi anagrammati scritti in una lingua e uno script sconosciuti”. Il lavoro è stato pubblicato nel 2016, ma presentato solo l’anno scorso in una conferenza e ripreso dai giornalisti all’inizio di questo mese. In esso, il professore di informatica Greg Kondrak e il dottor Bradley Hauer descrivono un metodo per ricavare il linguaggio sorgente dei testi cifrati, metodo applicato poi al manoscritto stesso. Ciò ha portato alla conclusione che il documento è stato originariamente scritto in ebraico, per poi essere codificato nel suo attuale modulo.

Questa affermazione, se fosse vera, sarebbe un fulmine a ciel sereno. Le 240 pagine del Voynich sono scritte in un alfabeto sconosciuto che non è mai comparso in precedenza e neppure più in futuro. La “sceneggiatura” è composta da circa 25-30 caratteri individuali (le interpretazioni variano) scritte da sinistra a destra in un’unica, elegante mano. Sparse in tutto il testo, vi sono illustrazioni di piante non identificabili, diagrammi astrologici, scarabocchi di castelli e draghi e una sezione particolarmente bizzarra che mostra donne nude che si bagnano in piscine collegate da tubi scorrevoli. Sembra la mappa di un antico parco acquatico, ma gli studiosi suggeriscono che potrebbero trattarsi di luoghi atti a scopi medici o alchemici.

Manoscritto Voynich — Le inquietanti vasche del manoscritto Voynich

La maggior parte degli esaminatori suppone che il testo sia scritto in quello che viene chiamato un “codice di sostituzione”. Con esso si intendue uno dei più semplici e antichi tipi di codici, in cui le lettere di un alfabeto stabilito vengono scambiate con altre inventate. Il problema è che centinaia di anni di studio non sono stati in grado di svelare in quale lingua il manoscritto Voynich fosse stato originariamente redatto.

Kondrak e Hauer hanno ipotizzato, come molti criptologi prima di loro, che calcolando alcune qualità dei testi (come, ad esempio, la frequenza con cui ogni lettera e ogni combinazione di lettere appare) si potesse risalire ad una “impronta digitale” per ogni linguaggio, paragonabile successivamente alle lingue esistenti.

Quindi, hanno ideato una serie di algoritmi per selezionare queste metriche utilizzando la Dichiarazione Universale dei Diritti Umani in ben 380 lingue come punto di partenza.
Questo processo non coinvolgeva reti neurali o apprendimento profondo, solo una buona analisi statistica vecchio stile, alias un sacco di conteggi e percentuali. E questa procedura… ha funzionato! Non senza difetti, ma comunque in modo accettabile. Secondo il professor Shlomo Argamon, un linguista computazionale dell’Illinois Institute of Technology, i risultati preliminari dei test sono “forse un po’ discutibili, ma non più di molti altri risultati spesso pubblicati nella letteratura scientifica”. E così, con il loro algoritmico “pattern-matcher” addestrato e testato, Kondrak e Hauer si sono rivolti al manoscritto Voynich.
Qui, dicono gli esperti, è dove le cose hanno iniziato ad andare a rotoli.

Il problema non è stato un singolo errore, ma una serie di supposizioni ed omissioni che hanno dato a Kondrak e Hauer più margine di discrezionalità nell’interpretazione dei loro risultati.

Manoscritto Voinich

Il primo è abbastanza semplice: il loro algoritmo è stato testato sulle lingue moderne, ma il manoscritto è datato al carbonio a fine XV secolo. Quindi, se fosse stato originariamente scritto in ebraico, sarebbe stato scritto nell’ebraico del XV secolo. “La grammatica, l’ortografia e il vocabolario sarebbero stati molto diversi, specialmente per un manoscritto come il Voynich che è scientifico (al contrario di testi biblici o liturgici) in natura “, afferma Davis.

Il secondo è che, sebbene l’algoritmo di Kondrak e Hauer possa produrre suggerimenti per le lingue di partenza dei testi cifrati, esso non valuta l’affinità di queste corrispondenze. Quindi, quando la coppia di studiosi dice che l’ebraico è stata la lingua con il punteggio più alto per il Voynich senza valutare la “probabilità”, ci troviamo di fronte a un “vanto non giustificato”: “Qualcuno deve per forza ottenere il punteggio più alto”, dice Argamon “I due studiosi menzionano anche alcuni degli altri risultati migliori: uno era il Malese, che è una lingua molto, molto diversa dall’ebraico.”

La terza supposizione è forse quella cruciale: Kondrak e Hauer sostengono che oltre a essere un cifrario di sostituzione, il Voynich è anche scritto in anagrammi, quindi le lettere di ogni singola parola sono criptate. Questa ipotesi non è nuova nel mondo della Voynichology, ma è lontana da una verità consolidata. Essa si adatta anche perfettamente al risultato finale delle ricerche di Kondrak e Hauer: la traduzione della frase di apertura del manoscritto Voynich in inglese. La frase in questione è la seguente: “Ha fatto raccomandazioni al sacerdote, all’uomo di casa e a me e alla gente”.

Voynich Botanica Manoscritto

Kondrak dice: “È di certo una strana frase per iniziare un manoscritto, ma ha sicuramente un senso.” All’interno dell’articolo, lui e Hauer descrivono come hanno dovuto pilotare la traduzione per produrre questo risultato. Il loro primo tentativo è stato “non del tutto coerente”, ha detto un oratore dell’ebraico moderno e hanno dovuto fare “un paio di correzioni ortografiche” prima di inserire i risultati in Google Translate per giungere alla conclusione di cui sopra. Ed è qui che l’ipotesi che il manoscritto sia stato composto in anagrammi diventa ancora più cruciale.

Argamon sottolinea che l’ebraico scritto è ciò che è noto come un “abjad”, che significa una sceneggiatura senza vocali. Se si presuppone che il testo sia stato redatto in ebraico e composto in anagrammi, diventa molto più facile “tradurre”. Quindi, non solo è possibile riorganizzare tutti i caratteri in una sola parola per ottenere qualcosa con un significato, ma è anche accettabile aggiungere le vocali di propia scelta.

Riflettendo su questa procedura, Argamon afferma che in questo modo: “sequenze di lettere casuali possono formare parole coerenti”. Se ciò si somma al fatto che Kondrak e Hauer hanno apportato correzioni ortografiche e si sono affidati a Google Translate è facile comprendere perché gli esperti siano scettici. “Questo metodo […] conferisce loro un’enorme libertà nel fare questa sorta di interpretazione impressionistica del testo”, dice Argamon. “Prendono questa frase decodificata, strizzano gli occhi attraverso occhiali spessi, e affermano che il risultato è accettabile.”

Nick Pelling, un esperto di Voynich che ha scritto molto sull’argomento, è più diretto. Quando gli viene chiesto con quante probabilità pensa che lo studio sia giunto a conclusioni corrette, dice: “Così vicino allo 0% che non fa alcuna differenza pratica”. Quindi: “l’AI ha decodificato il misterioso manoscritto di 600 anni”? La risposta è ancora una volta più vicina al no che al sì. In tutta onestà e per essere corretti nei confronti di Kondrak e Hauer (e come spesso accade con queste storie), è doveroso affermare che i media certamente meritano una notevole quantità di colpa per l’esagerazione della notizia. La coppia di criptologi ammette che la loro ricerca è solo un “punto di partenza” e gli esperti hanno riconosciuto l’utilità dei loro algoritmi di base anche se hanno anche sottolineato che troppi passi mancano per iniziare a fare affermazioni attendibili sul manoscritto stesso.

Da molti punti di vista, inoltre, è sensato che il tentativo di tradurre il Voynich per mezzo dell’AI sia in parte boicottato.
Un articolo del New Yorker sulla storia del manoscritto lo descrive come “la tela perfetta su cui proiettare le nostre preoccupazioni riguardo il difficile, lo spaventoso e l’arcano” e lo stesso si può affermare sull’intelligenza artificiale. Nel panorama dei media contemporanei questo complesso gruppo di tecnologie viene spesso utilizzato come punto di partenza per i timori sull’automazione e sull’intelligenza inconcepibile (e incontrollabile) delle macchine. Contrapporre l’AI al Voynich è come guardare Godzilla combattere Mothra: lo spettacolo è così divertente che non ci si sofferma troppo a riflettere sui dettagli.
Inoltre, per gli esperti, il fatto che il manoscritto resti impenetrabile potrebbe essere un sollievo. Infatti, dopo che numerosi e illustri studiosi hanno passato anni e anni della propria vita a cercare di decifrare un documento misterioso senza successo, sarebbe probabilmente un duro colpo se una macchina senza sangue lo risolvesse in una notte.

Il mistero, per ora, sopravvive.