L’intelligenza artificiale può imitare il cervello umano nel riconoscimento del significato delle parole? Non è una domanda banale, come spiegano gli esperti dell’UCLA, considerando anche che un team di ricercatori, provenienti dallo stesso istituto californiano nonché dal MIT e dai National Institutes of Health, ha realizzato un nuovo studio apparso sulla rivista Nature Human Behavior.
La questione riguardante la capacità di apprendere i significati delle parole a seconda del contesto fa parte di quella conoscenza complessa che ci rende esseri umani. I ricercatori hanno analizzato un nuovo sistema di intelligenza artificiale che, come rileva il comunicato, tende a rappresentare il significato delle parole in una maniera che può essere collegato alle modalità messa in atto dal cervello umano.
L’intelligenza artificiale analizzata dai ricercatori sembra capire i significati delle parole affidandosi ad enormi quantità di dati prelevati da Internet. Si parla di decine di miliardi di parole e queste ultime possono trovarsi, più o meno spesso, vicina ad altre. La maggiore vicinanza vicino ad un’altra parola da parte di una determinata parola è alla base del sistema per apprendere il loro significato. Tuttavia gli esseri umani non fanno solo ricorso alla frequenza con la quale le parole sono vicino ad altre parole per apprenderne il significato all’interno di una frase o di un contesto. Le cose sono molto più complesse.
Secondo quanto spiega Idan Blank, un assistente professore di psicologia e linguistica dell’UCLA e uno degli autori dello studio, il sistema applica una sorta di “buonsenso”. Con questa capacità di base un sistema informatico potrebbe un giorno arrivare a discernere tutte quelle sottili differenze che sono alla base della complessa capacità da parte degli esseri umani riguardo alla rappresentazione delle parole a seconda del contesto.
La tecnica usata da ricercatori, denominata “proiezione semantica”, è stata applicata a 52 gruppi di parole. Ad ogni categoria di parole venivano assegnati più contesti o dimensioni. I ricercatori eseguivano anche esperimenti con la partecipazione di 25 persone che dovevano eseguire delle valutazioni sugli stessi gruppi di parole. I ricercatori scoprivano che l’algoritmo lavorava in una maniera molto simile a quanto faceva il cervello dei partecipanti. Ad esempio l’algoritmo scopriva che i nomi “Betty” e “George” erano entrambi relativamente vecchi ma anche che appartenevano a due generi diversi. Inoltre l’algoritmo riusciva a capire, per esempio, che i termini “weightlifting” and “fencing” potevano avere un significato simile ma potevano indicare qualcosa di diverso a seconda del livello di intelligenza che questi compiti richiedevano. Secondo Blank si tratta di un metodo di apprendimento automatico “meravigliosamente semplice e completamente intuitivo” che mostra che considerando quali parole esistono insieme ad altre parole è possibile letteralmente “imparare molto sul mondo”. Questi progressi mostrano che un giorno forse anche le intelligenze artificiali potrebbero sfruttare la ricca conoscenza umana calcolando le caratteristiche multiple delle parole (nello studio si parla di parole come “vettori in uno spazio multidimensionale”) a seconda del loro inserimento in un contesto, qualcosa che è alla base del giudizio stesso.
Note, approfondimenti e fonti
- Can computers understand complex words and concepts? | UCLA
- Semantic projection recovers rich human knowledge of multiple object features from word embeddings | Nature Human Behaviour(DOI: 10.1038/s41562-022-01316-8)
Voxteca, archivio della voce è un Archivio/Osservatorio permanente delle voci, dei suoni e delle lingue contemporanee, usate anche dagli stranieri che frequentano l’Università e che vivono in Umbria. In Voxteca, presso il Dipartimento Scienze Umane e Sociali dell’Università per Stranieri di Perugia, sono custodite e analizzate le varietà del repertorio linguisitico, compresi i dialetti e gli italiani regionali, attraverso una ricca e variegata tipologia testuale. Nella sezione dedicata all’oralità, sono raccolti testi, suoni e canti di musica popolare e tradizionale contemporanea dell’Italia, della Romania, della Grecia, del Marocco, della Tunisia, dell’Egitto, della Giamaica; fanno pare del corpus in progress anche filastrocche giapponesi, favole armene, celtiche e mongole, birmane, islandesi, scioglilingua, canti e indovinelli arabi, indiani e cinesi
Responsabile progetto di ricerca: Antonello Lamanna