Bard, PaLM 2 e Gemini: Google integra l’AI nei suoi prodotti

Decisa a non perder terreno su Microsoft e OpenAI, Google si è tuffata nell’intelligenza artificiale, potenziando tutti i suoi prodotti e servizi con l’AI, a partire da Bard. Nel corso della conferenza Google I/O 2023, Big G ha mostrato i dettagli della rivoluzione.

L’AI rivoluziona Google

Da diversi mesi, Microsoft sta includendo l’AI in tutti i suoi prodotti e servizi, come l’ormai celebre Bing Chat. Grazie alla partnership con OpenAI, l’azienda di Remond è divenuta una vera e propria minaccia per Google, leader nel settore. La svolta per l’azienda di Mountain View è arrivata lo scorso 10 maggio, nel corso del suo annuale keynote. Google ha infatti dedicato due terzi dell’evento ai suoi progressi nel campo dell’AI, mostrando le funzioni che potremmo provare già dai prossimi mesi.

Sundar Pichai, CEO di Google, ha presentato svariate funzioni di AI generativa che arriveranno presto sui prodotti di Big G (Google Search, Gmail, Google Docs, Sheet e Slides, Google Foto, ma anche Android 14). Alla base di questa evoluzione ci sarà PaLM 2, il nuovo modello di linguaggio di Google, destinato ad essere primo competitor di GPT-4.

PaLM 2 e Gemini: nuovi modelli di linguaggio più potenti

PaLM 2 è il nuovo modello di linguaggio che si basa sul machine learning, sviluppato da Google. Recentemente ha terminato la sua fase di test, effettuata in più di 100 lingue, che gli ha permesso di migliorare le sue competenze di redazione. È stato inoltre “allenato” su un importante corpus scientifico e matematico, in modo da migliorare le sue capacità di ragionamento e di logica. Inoltre è migliorato nel coding, grazie all’apprendimento di 20 linguaggi di programmazione. S e un utente gli chiede di eseguire il debug di più righe di codice, potrà spiegare anche l'origine del codice e fornirgli le correzioni. Google ha presentato PaLM 2 come l’equivalente di GPT-4, il modello di linguaggio di OpenAI, che utilizza BingChat. La nuova versione di Bard si baserà quindi su PaLM 2, modello già integrato in 25 servizi dell’azienda.

A dir la verità, PaLM 2 si riferisce ad una famiglia di modelli di linguaggio, poiché si declina in più varianti: Gecko, Otter, Bison e Unicorn. Gecko è un modello più leggero destinato agli smartphone, che offre dei risultati più rapidi, anche offline. Questo approccio permette a Google di facilitare l’implementazione del modello di linguaggio. Quest’ultimo è anche stato aggiornato, sulla base di dati specifici di un dominio, in modo da effettuare azioni su domini ben precisi. Sec-PaLM 2 è una versione addestrata su dati di sicurezza che può rilevare gli script dannosi e le minacce. Per quanto riguarda Med-PaLM 2, si tratta di una versione con dei dati relativi alla salute che, secondo Google, riesce a rispondere a domande simili a quelle degli esami dei test di medicina ad un livello “esperto” (può ad esempio esaminare la radiografia di un braccio).

Google non ha intenzione di fermarsi. L’azienda sta infatti già lavorando al nuovo modello di linguaggio, ovvero Gemini. Questo contiene diversi miliardi di parametri e utilizza migliaia di chip TPU per l’addestramento. L’azienda di Mountain View lo descrive come multimodale, ovvero capace di trattare diverse fonti di dati, come testo, audio e immagini. Sarà inoltre rilasciato in più dimensioni.

Google Bard: l'IA riduce la distanza da Bing Chat

Fino ad oggi Google Bard non aveva proprio convinto. Causa di ciò la falsa partenza alla sua presentazione, con un errore proprio nel corso della dimostrazione. L’AI di Google si è quindi dimostrata un gradino sotto Bing Chat. Tuttavia adesso le cose sembrano essere cambiate.

Basata su PaLM 2, questo chatbot è dotata delle migliori competenze di ragionamento, di calcolo e di coding. A differenza di Microsoft Bing, Google integrerà Bard nel suo motore di ricerca tramite una modalità conversazione. L’AI risponderà infatti alle richieste degli utenti, tramite una propria finestra di dialogo. Piuttosto che sfogliare i vari risultati, questi riceveranno un riepilogo su misura che risponde alla domanda inviata. Inoltre, il chatbot di Google considererà anche il contesto della discussione. Più è dettagliata è la richiesta, più completa sarà la risposta.

Bard si distingue anche per il suo approccio multimodale. Il chatbot integra infatti gli altri servizi Google, come ad esempio Maps, Lens, Documenti o Presentazioni. Grazie a Lens, il suo programma di riconoscimento di immagini, Google Bard sarà capace di analizzare e comprendere le immagini, che possono essere anche utilizzate durante una richiesta. Allo stesso modo, il chatbot è anche capace di inserire immagini nelle sue risposte. Ad esempio, se si cercano informazioni su una destinazione, verranno visualizzate anche delle foto dei luoghi più popolari. Grazie a Google Maps è anche possibile visualizzare delle mappe, dei tragitti e dei punti d’interesse. Se gli viene chiesto di generare un database con delle informazioni, si potrà poi esportare su Google Fogli. La stessa cosa vale per gli altri prodotti, come Docs, Slides e Gmail. Google ha quindi sviluppato le capacità di programmazione di Bard. Non riesce infatti soltanto a generare del codice, ma anche spiegare le stringe e aiutare ad eseguire il debug.

Tra le altre novità, Bard integra dei servizi di terze parti, come Wolfram Alpha, Kayak, OpenTable, Instacart, ZipRecruiter e Khan Academy (come avviene con i plugin di ChatGPT). Inoltre, la sua associazione ad Adobe gli permette di generare immagini tramite Firefly, l’AI generativa dell’azienda, direttamente tramite la sua interfaccia. È infine possibile modificarle con l’aiuto di Express, il software di photo editing di Adobe.

Google ha quindi ridotto il suo ritardo anche su Bing Image Creator. Per provare Google Bard non bisogna più iscriversi alla lista d’attesa. Il chatbot è disponibile in inglese, giapponese e coreano, in 180 paesi. Purtroppo in Italia non è ancora possibile accedervi. Per testare Google Bard, ad oggi, è necessario utilizzare una VPN. Nei prossimi mesi l’azienda ha comunque assicurato che verrà rilasciato a livello globale e aggiungerà almeno altre 40 lingue.

Google I/O: l’AI in tutti i servizi

Google intende integrare l’AI in tutto il suo ecosistema. Anche Bard infatti raggiungerà presto Google Search. Quando un utente effettuerà una ricerca, sotto la barra di ricerca apparirà un riquadro verde (o blu), con la risposta completa generata dall’AI. Per ottenere informazioni aggiuntive, basterà cliccare sui link che appaiono sulla destra, con dei suggerimenti Google Shopping (se necessario).

L’AI verrà inclusa anche su Gmail, in modo da aiutare gli utenti a redigere le proprie e-mail, cliccando semplicemente sul tasto “Help me write”. Una volta selezionata questa opzione, basterà indicare l’idea generale del testo e l’AI genererà l’integralità dell’e-mail, prendendo anche in considerazione il contesto delle e-mail precedenti. Naturalmente sarà anche possibile modificare il testo per adattarlo ai propri bisogni. Durante la dimostrazione è stato generata automaticamente una richiesta di rimborso per il biglietto aereo, rispondendo ad una query di poche parole.

Anche la suite di Google Workspace (Docs, Sheet e Slide) potrà beneficiare dell’intelligenza artificiale, proprio come accade con 365 Copilot. A destra dell’interfaccia sarà infatti presente un modulo chiamato Sidekick, che permetterà di generare del testo, delle tabelle, delle diapositive, ecc. Su Docs, la funzione “Help me Write” aiuterà inoltre a creare testi appropriati, come offerte o candidature di lavoro. Lo strumento “Help me Organize” su Sheet permetterà poi di organizzare dei database automaticamente. Inoltre, utilizzando soltanto poche righe, può generare una tabella completa, adatta ai bisogni dell’utente. Infine, Slide beneficerà della funzione “Help me Visualize”, capace di generare immagini e creare testi per ogni dispositivo.

Sul versante Google Foto, sono stati integrati nuovi strumenti. Dopo la gomma magica, che permette di eliminare in qualche secondo un elemento indesiderato all’interno di un’immagine, arriva anche il Magic Editor. Questo strumento permette di spostare un soggetto all’interno dell’immagine in qualche click. L’intelligenza artificiale ricrea infatti i pixel mancanti e corregge la luminosità, in modo che l’immagine sia perfetta. Ad esempio, è possibile spostare il soggetto in primo piano, ma anche completare una foto creando elementi mancanti.

Anche Android 14 avrà la sua dose di intelligenza artificiale. Su Google Message, la funzione Magic permetterà infatti all’AI di scrivere un messaggio usando differenti stile (entusiasta, calmo, poetico, ecc.). Sarà infine possibile personalizzare il blocco schermo e creare i propri sfondi con effetti in prospettiva, con emoji, foto o prompt. Questa funzione verrà lanciata il prossimo mese sui dispositivi Google Pixel.

Foto: © Google.

I nostri contenuti sono creati in collaborazione con esperti di high-tech, sotto la direzione di Jean-François Pillou, fondatore di CCM.net. CCM è un sito di high-tech leader a livello internazionale ed è disponibile in 11 lingue.
Potrebbe anche interessarti
Il documento intitolato « Bard, PaLM 2 e Gemini: Google integra l’AI nei suoi prodotti » dal sito CCM (it.ccm.net) è reso disponibile sotto i termini della licenza Creative Commons. È possibile copiare, modificare delle copie di questa pagina, nelle condizioni previste dalla licenza, finché questa nota appaia chiaramente.