DALL-E: tutto ciò che devi sapere sull’AI che trasforma testi in immagini

Hai già visto immagini e scritte divertenti su Twitter? Sarai felice di sapere che queste immagini sono state create da un software di intelligenza artificiale chiamato DALL-E 2, capace di trasformare le tue parole in una nuova lingua specifica sviluppandone immagini realistiche. Ecco tutto ciò che devi sapere su DALL-E.

Cos’è DALL-E?

Il DALL-E è un nuovo A.I. software che trasforma le tue parole in immagini ed opere d'arte. Gli utenti possono semplicemente inserire un testo in lingua inglese e la rete neurale genererà un'immagine da esso. Lo strumento è sviluppato da OpenAI, una startup supportata da Microsoft, e dalla tecnologia Imagen di Google. Finora, la descrizione di DALL-E sul sito Web di OpenAI afferma che si tratta di "un nuovo sistema di intelligenza artificiale in grado di creare immagini e opere d'arte realistiche da una descrizione in linguaggio naturale", ed è esattamente quello che fa.

Può creare anche le immagini più improbabili: come “An astronaut riding a horse" (Un astronauta a cavallo). Nel gennaio 2021 OpenAI ha introdotto DALL-E, una versione precedente del software. Ora è un sistema più intelligente e nuovo: DALL-E 2.

I suoi sviluppatori affermano che “DALL-E 2 consentirà alle persone di esprimersi in modo creativo. DALL-E 2 ci aiuta anche a capire come i sistemi di intelligenza artificiale avanzati vedono e comprendono il nostro mondo, che è fondamentale per la nostra missione di creare un'intelligenza artificiale a beneficio dell'umanità".

Come funziona DALL-E?

Lo strumento DALL-E è una rete neurale gestita da OpenAI per generare immagini dal testo. Può combinare concetti non correlati e creare versioni antropomorfe di animali e oggetti. DALL-E collabora con CLIP, un sistema di visione artificiale che OpenAI ha già introdotto l'anno scorso. La rete neurale traduce il linguaggio umano nel proprio linguaggio e solo dopo lo trasforma in immagini.

Giannis Daras, un Ph.D di ricerca candidato in computer science, ha pubblicato su Twitter esempi di ciò che ha definito "il linguaggio dell'IA":

"Apoploe vesrreaitais significa uccelli", ha scritto Daras su Twitter. "Contarra ccetnxniams luryca tanniounons" significa insetti o parassiti".

DALLE-2 ha un linguaggio segreto. "Apoploe vesrreaitais" significa uccelli. "Contarra ccetnxniams luryca tanniounons" significa insetti o parassiti. Il prompt: "Apoploe vesrreaitais" mangiare, quindi "Contarra ccetnxniams luryca tanniounons" fornisce immagini di uccelli che mangiano insetti. Un thread (1/ n) pic.twitter.com/VzWfsCFnZo.

L'interfaccia di DALL-E è semplice: c'è una casella di testo in cui l'utente può inserire testo, un pulsante per avviare la conversione e immagini appena sotto di essa. I suoi sviluppatori spiegano come funziona DALL-E 2: "Utilizza un processo chiamato "diffusione", che inizia con uno schema di punti casuali e modifica gradualmente quel modello verso un'immagine quando riconosce aspetti specifici di quell'immagine".

Per ora, la nuova versione di DALL-E è disponibile solo per un piccolo gruppo di persone per evitare qualsiasi odio, nudità e dichiarazioni inappropriate che potrebbero danneggiare gli utenti. Tuttavia, puoi unirti alla lista d'attesa spiegando perché vorresti testare il programma e forse gli sviluppatori ti concederanno l'accesso anticipato.

Presto il software verrà aggiunto all'API in modo che possa essere utilizzato da sviluppatori di terze parti. Nel frattempo, puoi provare la versione "lite" di DALL-E: DALL-E Mini che crea anche immagini dal testo ed è open-source. Anche se a volte si blocca a causa di un gran numero di richieste.

Foto: © OpenAI.

Fai una domanda
I nostri contenuti sono creati in collaborazione con esperti di high-tech, sotto la direzione di Jean-François Pillou, fondatore di CCM.net. CCM è un sito di high-tech leader a livello internazionale ed è disponibile in 11 lingue.
Il documento intitolato « DALL-E: tutto ciò che devi sapere sull’AI che trasforma testi in immagini » dal sito CCM (it.ccm.net) è reso disponibile sotto i termini della licenza Creative Commons. È possibile copiare, modificare delle copie di questa pagina, nelle condizioni previste dalla licenza, finché questa nota appaia chiaramente.