Skip to main content

Generare immagini da un testo o da un’altra immagine

Se sei interessato all’affascinante mondo dell’Intelligenza Artificiale, probabilmente avrai letto anche tu la notizia recente di un quadro generato con l’AI che ha vinto un concorso. La notizia ha destato un po’ di scalpore e di certo non ha reso felici i partecipanti umani, ma ha anche attirato l’attenzione su una tecnica che sto studiando da un po’, di cui ti voglio parlare in questo articolo, su come generare immagini con l’Intelligenza Artificiale a partire da un testo o da un’immagine.

Si chiama Neural Style Transfer ed è una tecnica che utilizza algoritmi di Intelligenza Artificiale, in ambito Computer Vision per modificare e creare immagini attraverso il deep learning (reti neurali profonde).

Questa tecnica innovativa lavora generalmente su due immagini: l’immagine base che funge da contenuto principale e l’immagine stile, che invece va a modificare l’immagine base applicando uno stile diverso.

Per farti comprendere meglio di cosa parlo, ecco tre esempi molto famosi di applicazione del Neural Style Transfer alla Gioconda di Leonardo da Vinci.

Di certo molto interessante, quanto meno per le potenzialità dello strumento, meno per la povera Gioconda…

Se vuoi provare, puoi cercare siti e app come DeepArt e Prisma.

Se invece ti interessa approfondire l’intelliogenza artificiale, ti consiglio di leggere questo interessante libro di autori vari italiani con prefazione di Piero Angela.

Esiste anche un’altra tecniche molto affine, che permette di generare immagini, sempre usando il deep learning, a partire semplicemente da una descrizione testuale, vediamo come funziona.

Dall E 2 di Open-AI

Come ti dicevo, ci sono delle app online che ti permettono di generare immagini con l’Intelligenza Artificiale partendo semplicemente da una descrizione testuale, utilizzando un database preimpostato, da cui l’algoritmo di Intelligenza Artificiale estrapola le immagini per poi metterle insieme e formare un’unica composizione.

Se hai letto il mio articolo sui multipotenziali, avrai notato che ad un certo punto ho inserito l’immagine di un’astronauta che scrive un libro nello spazio. Ebbene sì, ho ottenuto quell’immagine utilizzando l’app Dall E 2 di Open-AI, partendo dalla descrizione in inglese: “An astronaut writing a book in the space” e questo è quello che ho ottenuto.

Come vedi, ho scelto solo una delle 4 varianti che il software ha generato a partire dalla mia descrizione. Inoltre, per ognuna di esse, è possibile creare ulteriori varianti fino ad avere un risultato soddisfacente. É anche possibile modificare delle immagini esistenti invece di partire da un testo, ma bada che al momento, invece, non è possibile modificare immagini che contengano un volto reale.

Dall E 2 è un software sperimentale creato da OpenAI (gli stessi di ChatGPT, di cui ho parlato qui), una software house la cui missione è garantire che l’intelligenza artificiale generale (AGI), vada a vantaggio dell’intera umanità. Insomma, l’obiettivo è quello di aiutare gli altri, sopperendo alle difficoltà tecniche con un pizzico di “creatività artificiale”.

Di sicuro il progetto è ambizioso ed interessante, da tenere d’occhio. Al momento l’app è gratuita, però è a numero chiuso, pertanto dovrai fare richiesta di essere inserito in lista se vuoi usare l’app (io ci sono riuscito perché mi sono iscritto prima del lancio). Puoi fare richiesta qui.

Midjourney

Aggiungo anche quest’app che è diventata popolarissima, anche perché la resa delle immagini prodotte a partire da un testo è di gran lunga migliore rispetto a Dall e 2.

Midjourney è un laboratorio di ricerca indipendente, gestito da un piccolo team di programmatori, che si occupa di design, nuovi mezzi di comunicazione e, ovviamente, Intelligenza Artificiale.

L’utilizzo di Midjourney è un tantino più laborioso, ma adesso ti spiegherò come fare per utilizzarlo. Innanzitutto, installa l’app Discord oppure accedi dal web. Poi utilizza questo link per avere l’invito alla stanza di Midjourney.

Dovrai anche iscriverti a Midjourney sul loro sito, in modo da poter recuperare agevolmente le creazioni e scaricarle. Puoi anche usare le credenziali Discord.

Una volta completate queste operazioni, ti basterà andare sul canale Discord scegliere uno dei thread contrassegnati come newbies e scrivere in chat:

/imagine

Ti apparirà la scritta prompt, quindi ti basterà iniziare a scrivere o copiare il testo che avevi preparato (in inglese).

L’AI genererà 4 immagini in un mosaico, cliccando sui pulsanti U (Upscale) potrai scegliere di elaborarne una singolarmente, mentre i pulsanti V (Variations) creano delle varianti, proprio come Dall e.

Con Midjourney puoi anche dare delle direttive precise su dimensioni, risoluzione e stile delle immagini, ad esempio puoi aggiungere dopo il testo descrittivo dell’immagine comenadi come -ar 16:9 per immagini in 16:9, o –ar 3:2 per immagini con risoluzione 1920:1280 (nella versione grande dell’immagine). Trovi tutte le opzioni nel manuale, così potrai divertirti a stilizzare le tue immagini. Puoi anche aggiungere dettagli sullo stile delle immagini, come cyberpunk, psychedelic, surreal, vaporwave, alien, solarpunk, modern, ancient, futuristic, retro, realistic, dreamlike, funk art, abstract, pop art, impressionism, minimalism, ecc. Altri consighli su un buon prompt li trovi qui.

Facciamo un esempio: prova ad aggiungere questo prompt:

Dante’s Inferno Depiction of the 7th Circle of Hell, Violence in Hell, 4k post-processing highly detailed, cinematic lighting, realistic concept art, horror realistic, photorealistic, red highlights, dark red river, trees with human heads in them, burning yellow sand, geryon the dragon, thick smoke, sog –ar 16:9

(Da Prompthero, un motore di ricerca per immagini AI).

Le possibilità, e le attività didattiche, sono infinite.

Prezzi

Midjourney ha un piano gratuito che ti permette di generare 25 immagini, dopodiché dovrai passare ad un piano a pagamento (da $10 al mese). Trovi tutti i piani qui.

Attività didattiche

Dopo la scrittura dell’articolo ho iniziato ad utilizzare lo strumento in classe, credo di essere stato tra i primi a sperimentare le potenzialità didattiche dello strumento.

Ecco alcuni esempi di attività svolte con i miei studenti:

  • Giornata mondiale per l’eliminazione della violenza sulle donne: ho chiesto agli studenti di prima sec. secondo grado, in gruppi di 4, di scrivere una descrizione testuale di scarpette rosse, secondo i loro gusti. Hanno poi tradotto la descrizione in inglese e l’abbiamo inserita in Dall e. Ogni studente ha scelto l’immagine che gli piaceva di più. Poi abbiamo riflettuto sul significato delle scarpe rosse, fatto un brainstorming in classe e infine ogni studente ha caricato la sua immagine su Canva e ha inserito una frase. Di seguito alcune delle immagini.

Con i miei studenti di quarta, invece, durante l’analisi del contesto geopolitico mondiale e parlando di guerra, abbiamo svolto il seguente esperimento. Ognuno ha prodotto una breve descrizione di cosa sia la guerra e poi abbiamo sottoposto queste descrizioni a Midjourney, che ha elaborato le immagini. Infine, abbiamo votato quale immagine fosse più realistica e corrispondente alla descrizione testuale. Una delle descrizioni era la seguente:

Razed city, gloomy gray sky, devastated and worried people who look up in search of hope, the suffering of children in the loss of their family members, people who are forced to leave their homes to escape the inevitable destruction of  the city.

I risultati sono stati davvero sorprendenti, giudica tu stesso/a.

Conclusioni

Spero di aver alimentato la tua curiosità su deep learning, Intelligenza artificiale, Neural Style Transfer e su come generare immagini con l’intelligenza Artificiale e ti invito a provare le app e costruire attività didattiche con i tuoi studenti, dando sfogo alla creatività!

Ti lascio con delle immagini appena generate, che descrivono come mi sento quando mi immergo nello studio o  nel lavoro davanti al PC… Il testo che ho usato: “A teacher working at PC on the Moon“.

Consigli di lettura

Se vuoi saperne di più sull’Intelligenza Artificiale, oltre a leggere il mio articolo e il libro con prefazione di Piero Angela che ti ho indicato sopra, ecco i miei consigli di lettura.

Questo articolo contiene link di affiliazione

Sostieni il mio lavoro!

Se ti è piaciuto l’articolo puoi compiere le seguenti semplici azioni per sostenere il mio lavoro:

Non hanno nessuno costo per te ma un grande valore per me!

Se vuoi organizzare un corso di formazione per la tua scuola, dai un’occhiata al mio nuovo catalogo!

Un caffè al prof!

Se invece vuoi supportare la creazione di contenuti con una piccola donazione tramite PayPal, puoi farlo cliccando il pulsante.

Grazie!

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.