Come funziona l’intelligenza artificiale di Big G?
Sono state annunciate ufficialmente due novità in casa Google. Si tratta di un importante salto quantico in termini di innovazione. Infatti, da un lato ci troviamo con Google MUM che permette di ottenere risposte a ricerche più complesse sul motore di ricerca, dall’altro Google LaMDA offrirà le conversazioni con l’intelligenza artificiale che daranno l’impressione di parlare con una persona in carne ossa. È un importante salto in avanti dal punto di vista tecnologico che certamente richiederà degli aggiornamenti e aggiustamenti di tiro strada facendo, ma che sin da ora promette risultati impressionanti. Vediamo insieme più da vicino come cambierà il nostro rapporto con la tecnologia grazie a Google MUM e Google LaMDA.Google guarda al futuro e con una nuova tecnologia offre la possibilità ai propri utenti di rispondere a domande complesse che non hanno risposte dirette: Google MUM, ovvero Google Multitask Unified Model. Ovviamente la BIG G non ci rivela il funzionamento del nuovo sistema, ma ha pubblicato dei documenti di ricerca che offrono degli indizi su cosa sia l’intelligenza artificiale MUM.
Sappiamo che MUM permette di ottenere risposte alle query di ricerca più complesse e che è costruito sull’architettura Transformer di Google, ma è 1000 volte più potente di BERT.
Il numero 1000 non è un’allegoria, ma si riferisce ai 1000 nodi della rete neurale che permettono di ricreare esattamente le sinapsi del cervello umano e rispondere alla ricerca dell’utente.
Google MUM funziona con 75 lingue e gestisce vari compiti contemporaneamente, con una conoscenza contestuale più aggiornata rispetto ai modelli in circolazione.
Un ulteriore vantaggio è che MUM può gestire diverse modalità. Per ora, può comprendere testo e immagini, ma in futuro sarà in grado di gestire anche video e audio.
Per spiegare il funzionamento di MUM, Google ha esposto un caso per dimostrare l’utilità del nuovo sistema. Se una persona fa un’escursione sul Monte Adams e ora sta progettando di farne una sul Monte Fuji vorrà avere informazioni su come prepararsi diversamente, l’attrezzatura, il meteo, la tipologia di terreno.
Google Search permette certamente di ottenere risposte a tutte queste domande, ma richiede molto più tempo e più query di ricerca.
Questo è il genere di risposte che un esperto sarebbe in grado di dare velocemente. Google MUM sostituisce l’esperto e fornisce in un unica query tutte le risposte che riguardano la domanda complessa.
MUM mira a costruire su questo esempio ancora di più, utilizzando la conoscenza del mondo per consigliarvi tecniche di allenamento, attrezzature di alta qualità, e altri utili sotto-argomenti con una singola e semplice query di ricerca.
Google MUM è impressionante, perché permette di rispondere a domande complesse che ad oggi richiedono paragrafi di informazioni contenenti più sotto argomenti
Questa nuova tecnologia di casa Google punta utilizzare l’intelligenza artificiale e creare conversazioni che diano l’impressione che si stia parlando con un essere umano. Normalmente una conversazione tra due persone parte da un argomento, ma spesso si finisce a parlare d’altro, senza un particolare nesso logico nel dialogo. L’intelligenza artificiale di Google, LaMDA, vuole fare la stessa cosa.
Google LaMDA che significa Modello linguistico per applicazioni di dialogo è un sistema che permette di gestire argomenti potenzialmente infiniti, rendendo l’interazione piacevole per l’essere umano.
Il report di Google segnala che le capacità di conversazione di LaMDA hanno richiesto anni di lavoro. Come BERT e GPT-3, anche LaMDA è costruito su Transformer, l’archietettura di rete neurale che è diventata open source pochi anni fa e che ha subito l’addestramento a leggere molte parole, prestare attenzione a come le parole si relazionano e prevedere quelle che verranno dette in seguito. I modelli linguistici funzionano tutti seguendo questo modello. Tuttavia, Google LaMDA si basa sul dialogo, che è una forma di linguaggio particolare e diversa rispetto alle altre. LaMDA si basa sulla ricerca del senso all’interno della conversazione e il modello di linguaggio è stato addestrato per captarlo.
Vediamo ora come funziona Google LaMDA.
Google LaMDA potrebbe imparare a parlare praticamente di ogni cosa, com’è emerso da una ricerca di Google pubblicata nel 2020. Una volta addestrato, il modello può essere perfezionato fino a migliorare la sensibilità e la specificità delle risposte.
Google sta valutando inoltre se le risposte sono divertenti, inaspettate o perspicaci.
Si pone, in questo contesto, anche la questione della sicurezza, perché come in tutte le tecnologie uno strumento può essere impiegato anche per un uso improprio, per esempio con discorsi di odio o facendo discorsi fuorvianti.
Google ha dichiarato di mettere l’impegno nel ridurre al minimo i rischi legati ai modelli di linguaggio e tecnologie come LaMDA, per evitare i pregiudizi, i discorsi di odio e similari.
Il punto forte di Google LaMDA è che è in grado di comprendere il contesto della conversazione e di fornire risposte coerenti, ma il rischio è sempre quello che questa tecnologia sfugga di mano se si utilizzano modelli di apprendimento sbagliato.
Quello che accomuna Google MUM e Google LaMDA è la visione del futuro, un futuro in cui il linguaggio non è una barriera. La lingua può essere una barriera importante per l’accesso alle informazioni. Google MUM si prefigge di abbattere e superare i confini tradizionali, perché può utilizzare ben 75 lingue diverse per portare le informazioni complete all’utente nella sua lingua di ricerca.
Per quanto riguarda Google LaMDA, l’intelligenza artificiale ha ancora bisogno di tempo per padroneggiare completamente il dialogo, acquisire la capacità di fare domande inaspettate e cambiare argomento.
Questo è tipico dell’essere umano, ma è ancora distante dall’intelligenza artificiale che in futuro potrebbe assumere un ruolo attivo nella conversazione.
L’essere umano è in grado di cogliere il senso più ampio del contesto in cui si trova, mentre alla tecnologia manca completamente il quadro d’insieme all’interno del quale si svolge un dialogo tra due persone.