Carocci editore - Lingue e intelligenza artificiale

Password dimenticata?

Registrazione

Lingue e intelligenza artificiale

Mirko Tavosanis

Lingue e intelligenza artificiale

Edizione: 2018

Ristampa: 1^, 2018

Collana: Bussole (555)

ISBN: 9788843090136

In breve

Le tecniche di intelligenza artificiale stanno ampliando in modo sorprendente le capacità di elaborazione automatica del linguaggio. Gli assistenti vocali, da Siri a Cortana fino ad Alexa e Google, sono diventati rapidamente strumenti versatili e diffusi. Usare la voce per dettare testi e messaggi è un’esperienza di tutti i giorni. Da un continente all'altro, persone che non parlano la stessa lingua riescono a comunicare attraverso la traduzione automatica di Skype. Tuttavia, non sempre è facile rendersi conto di quali sono le potenzialità o i limiti delle nuove tecnologie. Google è disturbato dagli accenti regionali? Perché la trascrizione delle conversazioni ancora non funziona? Il libro presenta per la prima volta una descrizione sistematica degli strumenti disponibili, un controllo delle loro capacità reali e qualche ipotesi sugli effetti che possono avere sulla comunicazione umana.


I problemi del riconoscimento

La lingua parlata pone tutta una serie di problemi complicati e collocati su livelli diversi. Anche partendo solo dal punto di vista fonetico, il parlato umano è molto diverso a seconda del produttore: i maschi hanno in media una voce diversa da quella delle femmine, i bambini hanno una voce molto diversa da quella degli adulti, i singoli individui hanno voci diverse tra di loro, e così via. Gli esseri umani notano alcuni di questi tratti in modo conscio; nella grande maggioranza dei casi sono poi inconsciamente e istintivamente in grado di distinguere la voce di un adulto da quella di un bambino, o di identificare una persona sulla base della sua voce. Ma al tempo stesso gli esseri umani hanno l’impressione che una frase come “ho aperto io la porta” sia esattamente la stessa, indipendentemente dalla persona che la pronuncia. Dal punto di vista fonetico semplicemente non è così e le enunciazioni hanno diversità quantificabili per quanto riguarda intensità, frequenza dei suoni e durata. [...]

Una delle domande più immediate riguarda quindi la capacità di strumenti di questo genere di interpretare correttamente il parlato effettivo in situazioni come quella italiana, in cui anche all’interno della lingua nazionale esiste una grande varietà di pronunce locali. Si può dire subito che il livello di riconoscimento è ottimo. Tuttavia, dimostrare questo risultato richiede molti accorgimenti, che possono servire come riferimento anche per situazioni simili.

Indipendentemente dall’influsso di una pronuncia locale, nella catena del parlato sono per esempio regolari processi di fusione, elisione, mutamenti di timbro, assimilazione di consonanti e di vocali. Anche in una pronuncia italiana molto controllata una frase come “aspetto un amico” può per esempio essere pronunciata senza la u di un: “aspettonamico”; una frase come “è proprio vera anche questa” può essere pronunciata come “èppropioveranchequesta”, e così via. Inoltre, molto spesso la conversazione spontanea allontana ancora di più il parlato dal modello della lingua stampata o delle battute di dialogo presentate in un romanzo. L’assieme di queste circostanze rende impossibile un riconoscimento del parlato basato semplicemente sul confronto meccanico tra una serie di suoni e un modello ben definito di parola. In altri termini: si può trovare una chiave precisa all’interno di un mazzo semplicemente provandole tutte con la serratura che interessa, fino a trovare quella giusta, ma nel caso della lingua parlata o della traduzione questo sistema non funziona. Data la registrazione di una parola in una lingua, non è possibile confrontarla con una serie di modelli rigidi delle parole di quella lingua e vedere a quale corrisponde. Occorrono sistemi più sofisticati e meno intuitivi. Inoltre, anche quando si ottiene una trascrizione non è detto che i dati risultanti siano sufficienti a una vera comprensione. Il linguaggio umano è ambiguo e, anche nei suoi usi più formali, può essere interpretato solo attraverso la conoscenza di molti presupposti. A metà degli anni Sessanta si poteva stimare che la traduzione di un articolo scientifico dal normale inglese a un inglese privo di ambiguità potesse richiedere un’ora di lavoro: oggi è evidente che le ambiguità logiche sono molto superiori e che molte congiunzioni (da e a perché) hanno in realtà un tale numero di significati da rendere molto pesante il compito di convertire un testo normale in affermazioni davvero prive di ambiguità. Linguaggi artificiali inventati appositamente per parlare in modo non ambiguo, come il Loglan o il Lojban, sono risultati troppo difficili per essere usati in conversazioni in tempo reale anche da persone motivate.

Indice

1. Storia e contesto
Che cosa si intende oggi per “intelligenza artificiale”/L’elaborazione automatica del linguaggio/I problemi posti dal linguaggio/La differenza tra riconoscimento e comprensione/I problemi del riconoscimento/Dalle regole alla statistica
2. Gli strumenti disponibili
La diversità linguistica e l’elaborazione automatica/Le caratteristiche degli strumenti/Un problema risolto: la sintesi vocale
3. Il riconoscimento del parlato
I sistemi principali/La gestione delle lingue/Il rapporto con la punteggiatura/Gli indicatori e i risultati
4. La trascrizione delle conversazioni
Le caratteristiche del parlato/Le caratteristiche della conversazione/Il riconoscimento della conversazione
5. Il dialogo con le macchine
Una lingua per le macchine/Gli assistenti vocali/Verso la conversazione a voce/Il dialogo testuale
6. La traduzione automatica
La storia della traduzione automatica/I sistemi principali/La traduzione dei testi scritti/La traduzione del parlato 1
7. Gli sviluppi prevedibili
I limiti della comprensione e la creatività/Lavorare con la voce/La fine delle lingue franche
Bibliografia