Intelligenza artificiale per creare immagini: cosa c'è da sapere

Le innovazioni tecnologiche hanno cambiato negli anni la vita e la socialità delle persone, basti pensare a quello che è successo con l’avvento di Internet e degli smartphone. Ora una nuova rivoluzione sembra esserci all’orizzonte dovuta alla cosiddetta intelligenza artificiale conosciuta anche con l’acronimo di AI. Ma di cosa si tratta realmente e soprattutto come è possibile sfruttarla per la creazione di immagini?

Che cosa si intende per intelligenza artificiale?

Nell’immediato dopoguerra, l’uomo ha perseguito l’ideale di creare una entità astratta che svolgesse dei compiti in sua sostituzione. Parliamo in buona sostanza della Artificial Intelligence AI ossia l’intelligenza artificiale. L’obiettivo è quello di creare una macchina in cui si riflettono le capacità dell’uomo di saper riconoscere determinati processi e creare cose gestendo servizi di vario genere. Le prime intuizioni arrivarono dallo scienziato Alan Turing che, peraltro, è il padre della moderna informatica in quanto ideatore della struttura che poi ha permesso di creare i personal computer che ancora oggi si utilizzano sotto forma di smartphone, tablet, pc desktop e portatili di vario genere. L’idea di fondo è quella di simulare le caratteristiche del corpo umano perché la macchina di Turing prevede un processore che dovrebbe essere il cervello della struttura e una serie di periferiche per interagire con l’ambiente esterno. Il processore, in maniera autonoma, deve saper interpretare le informazioni che arrivano in ingresso e quindi successivamente elaborarle per produrre un output che può essere il risultato di un’operazione matematica oppure un’azione della quotidianità come la preparazione di una tazza di caffè. Il concetto di intelligenza artificiale è dunque quello di saper creare in autonomia un servizio che nel nostro caso specifico è quello della creazione di foto IA ossia immagini ottenute letteralmente dal nulla dall’intelligenza artificiale. Per poter offrire un servizio ottimale, la macchina deve innanzitutto avere delle nozioni e percezione visiva o spazio temporale. Gli investimenti nel settore dell’intelligenza artificiale sono stati importanti negli ultimi anni e stanno iniziando a dare i propri frutti con diversi campi di applicazione. si pensi, ad esempio, alla capacità di una vettura di parcheggiare autonomamente senza nessun intervento del guidatore, sfruttando le informazioni che arrivano dalle telecamere poste nelle parti laterali. Per quanto concerne la creazione di immagini ci sono diverse applicazioni che sfruttano il concetto di intelligenza artificiale per proporre in autonomia delle immagini originali per cui non protette dai diritti d’autore e quindi utilizzabili come meglio si crede.

Come funziona Imagen?

In commercio ci sono delle App per foto che sfruttano il concetto di machine learning e quindi di intelligenza artificiale per creare immagini come nel caso di Imagen. Si tratta di una forma di intelligenza artificiale realizzata da Google grazie alla quale è possibile creare delle foto partendo esclusivamente da una richiesta scritta che viene fatta dall’applicazione. In questo caso, l’applicazione interpreta un file messaggio di testo che viene fornito dall’utente e restituisce un’immagine dopo averla elaborata attraverso una procedura sviluppata negli anni con algoritmi specifici. Si ottiene quindi un output visivo che rende il tutto semplicissimo ma in realtà dietro c’è un percorso estremamente complesso fatto di tantissime operazioni. Il funzionamento di Imagen è basato non solo sulla capacità di interpretare l’input dell’utente ma anche di ricorrere costantemente ad un enorme database di immagini che fanno riferimento al mondo della natura, cose e oggetti della quotidianità, paesaggi e così via. Ancora oggi questa applicazione è sottoposta ad una fase di rivisitazione delle caratteristiche per migliorare l’elaborazione e quindi il risultato finale. Infatti, attualmente l’applicazione non è a disposizione degli utenti perché c’è ancora una fase di test da effettuare e di ricalibrazione che devono essere portata avanti per gestire sempre nuove risorse. Un altro motivo per il quale non è stata ancora data l’opportunità agli utilizzatori di poterne fruire, è che possono essere generate delle foto sgradevoli per il pubblico per diverse questioni dal punto di vista etico, sessuale oppure per questioni di natura religiosa.

Come funziona MidJourney?

Un’altra applicazione in grado di interpretare gli input testuali da parte dell’utente da trasformare in foto è MidJourney. Si parla ugualmente di un sistema basato sull’intelligenza artificiale che crea immagini di qualsiasi genere. Anche in questo caso l’utente non deve fare altro che inserire nell’apposito campo dei testi che diano delle informazioni specifiche che devono essere interpretate dalla macchina per poi elaborare un’immagine assolutamente originale. Attualmente, questa applicazione è stata resa disponibile in una versione beta, per cui è ancora in fase di evoluzione e di miglioramento anche se l’utente può iniziare l’attività con la prova gratuita che include circa 25 prompt. Inoltre, l’utente può passare alla versione più professionale con un abbonamento. Per poter utilizzare questa applicazione di creazione di immagini occorre però avere un account Discord per poi utilizzare il programma sia su uno smartphone scaricando l’apposita App, sia con la versione browser web direttamente dal sito dell’azienda. Dopo aver creato l’account, sarà sufficiente utilizzare una delle soluzioni appena indicate per valutare i risultati da ottenere con questo creatore di immagini. L’utente inserisce delle parole chiavi che vengono interpretate dall’applicazione per restituire un’immagine che poi dovrà essere sottoposta alla supervisione dello stesso utente che avrà delle opportunità. La prima è quella di creare una versione più grande dell’immagine appena ottenuta. La seconda è di variarne le caratteristiche, affinando il risultato finale. Ulteriore opzione è quella di aggiornare l’output ottenuto con il sistema che proporrà altre quattro soluzioni ossia 4 immagini partendo sempre dagli stessi testi indicati in input.