Uno sguardo alla nuova Al Generative Art

Al arte generativa è un tipo di arte, nella maggior parte dei casi visiva, che si basa sulla cooperazione tra un essere umano e un sistema autonomo. Un “sistema autonomo” è definito come un Intelligenza Artificiale software, algoritmo o modello in grado di eseguire operazioni complesse senza la necessità dell'intervento del programmatore.

Dalle bizzarre giustapposizioni di immagini create da Dall-E Mini Vai all’email NFT mercato, le immagini generate dagli algoritmi AI stanno entrando sempre più nell'immaginario mainstream. Infatti, due progetti importanti sul tema che meritano di essere analizzati sono: Metà viaggio ed DALL-MI2.

Ovviamente la notizia è arrivata anche su Twitter. A commentarlo, tra gli altri, è Charles Hoskinson, che ha scritto:

Arte generata dall'intelligenza artificiale. Sono riuscito a fare questa foto in pochi minuti. Non riesco a immaginare quanto sarà straordinaria questa tecnologia tra 3 anni pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) 1 Febbraio 2023

Al Generative Art: primi esperimenti e caratteristiche

Avendo compreso cos'è l'Arte Generativa, è importante sottolineare uno dei suoi principi fondanti: casualità. Che è una proprietà fondamentale della Generative Art.

Infatti, a seconda del tipo di software, il sistema autonomo è in grado di elaborare risultati sempre diversi e univoci ogni volta che viene eseguito il comando generate, oppure può restituire un numero variabile di risultati in risposta all'input dell'utente.

I primi esperimenti di Generative Art risalgono agli anni '1960 con gli esperimenti di Harold Cohen e la sua AARON programma. Cohen ha utilizzato per la prima volta un software autonomo per generare opere d'arte astratte ispirate alle serigrafie della Pop Art. Le opere di Cohen sono ora in mostra alla Tate Gallery di Londra.

Un altro attributo della Generative Art, ma sempre meno prerogativa, è la ripetizione di pattern o elementi astratti forniti dal programmatore e implementati all'interno del codice software.

Inoltre, lo sviluppo di reti neurali sempre più complesse operanti sull'associazione testo-immagine ha consentito lo sviluppo di modelli generativi in grado di creare immagini sempre più realistiche e precise. L'esempio più noto di questa categoria di Generative Art è Lastra.

Dall-E è una rete neurale multimodale basata su GPT-3 modello di deep learning da OpenAI, la stessa società che si è sviluppata anche di recente ChatGPT, il chatbot lanciato nel novembre 2022 e ottimizzato con "supervisionato" e tecniche di apprendimento per rinforzo.

Tornando a Dall-E, vediamo che questo sistema è in grado di generare immagini da una descrizione testuale, chiamata a "richiesta," basato su un set di dati di coppie testo-immagine.

La prima versione di Dall-E, presentata al pubblico nel gennaio 2021 e rimasta appannaggio di un ristretto numero di professionisti del settore, ha rappresentato una vera e propria rivoluzione in termini di questo tipo di modello generativo, superando le innovazioni di GPT- 3 stesso.

Significativo è anche il fatto che l'accuratezza dei risultati elaborati da Dall-E si è rivelata l'ambito perfetto per un'altra soluzione OpenAI: CLIP (Pre-formazione Contrasiva Linguaggio-Immagine).

Una rete neurale di classificazione e classificazione delle immagini addestrata sulla base di associazioni testo-immagine, come le didascalie trovate su Internet. Grazie all'intervento di CLIP, che ha ridotto a 32 il numero di risultati proposti all'utente per prompt, Dall-E ha restituito nella maggior parte dei casi immagini soddisfacenti.

Midjourney: design, infrastrutture umane e intelligenza artificiale

Come anticipato, Metà viaggio è un progetto importante che fa parte del concetto emergente di Al Generative Art. Nello specifico, Midjourney è un laboratorio di ricerca indipendente che esplora nuovi modi di pensare ed espande i poteri immaginativi della specie umana.

Usarlo è semplice: prima bisogna creare un account su Discordia, una piattaforma che ospita varie community, di cui Midjourney è una di queste. All'interno dell'applicazione ci sono le varie chat in cui si può partecipare attivamente o meno alle discussioni.

È importante sottolineare che per provare a utilizzare l'Intelligenza Artificiale per la prima volta bisogna andare al "neofiti" canali, dove 25 rendering gratuiti sono disponibili.

Un rendering corrisponde alla generazione di quattro diverse varianti generate dallo stesso input testuale.

Pertanto, i 25 rendering si riferiscono a 25 processi di elaborazione eseguiti dal bot Midjourney. Di conseguenza, la generazione dell'immagine richiede l'interazione con il bot Midjourney tramite un messaggio di testo chiamato "prompt", in cui ci saranno parole chiave che descrivono l'immagine che l'utente ha in mente.

Puoi aggiungere tutti i dettagli che vuoi, l'importante è dividere le parole chiave con una virgola. Una volta terminato il rendering, il computer restituisce quattro diverse immagini in base alle descrizioni tra cui scegliere.

Inoltre, una volta che il programma ha terminato il rendering, puoi comunicare le tue preferenze in base alle immagini e, se lo desideri, generare di nuovo altre quattro versioni.

DALL-E 2: il nuovo sistema AI per le opere d'arte

Oltre a Midjourney, DALL-E 2 è anche il nuovo sistema AI in grado di creare immagini e opere d'arte realistiche da una descrizione in linguaggio naturale. Non solo, DALL-E 2 può anche combinare concetti, attributi e stili.

La forza del nuovo sistema di intelligenza artificiale sta anche nel poter espandere le immagini oltre ciò che è nella tela originale, creando nuove composizioni espansive. Inoltre, può apportare modifiche realistiche alle immagini esistenti da una didascalia in linguaggio naturale e può aggiungere e rimuovere elementi tenendo conto di ombre, riflessi e trame.

Le capacità di DALL-E 2 includono anche l'acquisizione di un'immagine e la creazione di diverse varianti ispirate all'originale. DALL-E 2 ha imparato la relazione tra le immagini e il testo usato per descriverle.

Utilizza un processo chiamato "diffusione," che inizia con uno schema di punti casuali e altera gradualmente tale schema verso un'immagine quando riconosce aspetti specifici di quell'immagine.

Quindi, dopo che OpenAI ha introdotto DALL-E nel gennaio 2021, ora il sistema più recente, DALL-E 2, genera immagini più realistiche e accurate con una risoluzione quattro volte superiore.

DALL-E 2 è iniziato come progetto di ricerca ed è ora disponibile come file versione beta. Le mitigazioni della sicurezza che il sistema ha sviluppato e che continua a migliorare includono: limitazione della capacità del sistema di generare immagini violente, di odio o per adulti e distribuzione graduale basata sull'apprendimento.

Fonte: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/