Le capacità degli strumenti di generazione di immagini di intelligenza artificiale (AI) sono cresciute a un ritmo terrificante. Questi sono alcuni dei migliori sul mercato.
Se il 2023 ha una parola d’ordine definitiva, deve essere “intelligenza artificiale generativa”.
L’esplosione di interesse per il chatbot ChatGPT di OpenAI ha posto le basi per un anno in cui milioni di persone hanno iniziato a utilizzare per la prima volta strumenti di intelligenza artificiale generativa.
Mentre interi articoli o documenti d’esame possono essere generati da un semplice messaggio di testo, i suggerimenti di testo possono essere utilizzati anche per generare immagini. Sono emerse molte piattaforme che consentono agli utenti di creare opere d’arte, poster, loghi, presentazioni e immagini fotorealistiche alimentandole con poche parole.
Possono farlo grazie al machine learning. Le reti neurali vengono addestrate su enormi set di dati, imparando a identificare modelli e caratteristiche nelle immagini. L’algoritmo utilizza quindi questa conoscenza appresa per prevedere cosa sta cercando un messaggio di testo.
Diamo uno sguardo ad alcuni degli strumenti di generazione di immagini più popolari oggi disponibili. Prima di immergersi e utilizzare le piattaforme, vale la pena prestare attenzione alla situazione dei diritti d’autore sulle immagini generate dall’intelligenza artificiale. Ci sono già una serie di cause legali in corso, con artisti che chiedono danni da aziende le cui piattaforme di intelligenza artificiale, secondo loro, sono state addestrate sul loro materiale protetto da copyright.
Diamo un’occhiata a cinque dei migliori generatori di immagini disponibili oggi.
A metà viaggio
Richiesta: “Un potente mago che lancia un incantesimo”
Uno dei primi generatori di immagini AI a diventare grande, Midjourney ha attirato milioni di utenti sulla sua piattaforma poiché gli utenti sono rimasti stupefatti dalle sue capacità e attratti dalla sua prova gratuita.
La prova gratuita non esiste più, quindi dovrai pagare subito un abbonamento per provarlo tu stesso, con prezzi a partire da $ 8 (€ 9,33) al mese.
Il processo può essere complicato, poiché funziona tramite Discord piuttosto che su una piattaforma autonoma. Con alcuni tentativi ed errori, o prendendo lezioni dalle numerose guide disponibili online, vedrai rapidamente quanto sia potente Midjourney, creando immagini fotorealistiche, disegni, cartoni animati o schizzi a tuo piacimento.
Non c’è da stupirsi che abbia già più di 15 milioni di utenti.
DALL·E 2
Richiesta: “Dipinto di un aereo che decolla al tramonto nello stile di Vincent van Gogh”.
Dall’azienda dietro il popolarissimo ChatGPT, DALL·E 2 di OpenAI è un altro popolare strumento per la creazione di immagini.
Gli utenti possono generare un numero di immagini con il piano gratuito e dovranno iscriversi a un piano a pagamento per farlo in blocco. La piattaforma vanta milioni di utenti, anche se non sembra funzionare bene come Midjourney per immagini in stile fotorealistico. Ciò in cui eccelle sono le opere d’arte, con un’abilità nel copiare lo stile di pittori famosi.
E proprio come GPT-4 di OpenAI alimenta il chatbot AI del motore di ricerca Microsoft Bing, DALL·E 2 alimenta anche lo strumento di generazione di immagini di Bing.
DreamStudio (diffusione stabile)
Richiesta: “Una tazza di tè fumante su un tavolo di legno rustico. Gli alberi sono visibili attraverso una finestra sullo sfondo”.
Un altro dei primi grandi successi, Stable Diffusion è un popolare modello di generazione di immagini, con uno strumento gratuito sul browser web. DreamStudio utilizza il modello Stable Diffusion e ha una serie di opzioni e un’interfaccia utente professionale.
Quando ti iscrivi ricevi una certa quantità di crediti gratuiti e dovrai poi pagare per ricaricarli. I risultati sono impressionanti, soprattutto quando si generano volti umani, anche se, come tutti questi generatori di immagini, sembra avere un problema particolare con le mani umane.
Sogno di WOMBO
Richiesta: “Stazione spaziale aliena”
Orientato alla generazione artistica, come le altre piattaforme, basta inserire un semplice messaggio di testo e fornirà le immagini immaginate dagli algoritmi. Come suggerisce il nome, le immagini che produce sono in qualche modo oniriche, con risultati astratti e spesso inquietanti.
Con dozzine di stili artistici tra cui scegliere (compresi cose come “brutto viaggio” o “steampunk”) è un vero e proprio parco giochi per la creazione artistica. È disponibile come app Web e app mobile.
Tela
Richiesta: “Un uomo alla guida di una supercar lungo una strada con la Torre Eiffel sullo sfondo.”
La popolare piattaforma di progettazione grafica, ampiamente utilizzata per creare post e presentazioni sui social media, è entrata a pieno titolo nell’intelligenza artificiale generativa.
Lo includiamo come menzione speciale perché le sue capacità nel generare i tipi di media sopra menzionati sono davvero impressionanti. Ha anche un’intelligenza artificiale gratuita per la creazione di immagini che forse è un po’ meno raffinata in questo momento.
Ha regole piuttosto rigide sui tipi di immagini che creerà.
Ad esempio, si è rifiutato di rappresentare Emmanuel Macron alla guida di una Ferrari lungo gli Champs-Élysées, quindi ci siamo dovuti accontentare di un “uomo che guida una supercar lungo una strada con la Torre Eiffel sullo sfondo”.
Sembra che sia ancora in una fase di work-in-progress.
Image:Getty Images