Ideogram, un generatore di immagini AI creato da ex ingegneri di Google, ha rilasciato la sua prima serie di aggiornamenti destinati a rendere la piattaforma più funzionale e utilizzabile. Gli aggiornamenti aggiungono funzionalità che permettono di allinearsi meglio alle offerte di Stable Diffusion e Midjourney a un prezzo interessante.
La prima versione pubblica di Ideogram, rilasciata a febbraio, ha rapidamente guadagnato popolarità tra gli appassionati di IA come alternativa forte e capace a Midjourney, Dall-E 3 e Stable Diffusion. I test condotti da TCN hanno rilevato che Ideogram eccelle nella comprensione immediata, nella capacità di generare testo, nella consapevolezza spaziale, nell’aderenza immediata, nella varietà di stili, nella generazione di persone e marchi e nella qualità complessiva rispetto ad altri generatori di immagini popolari.
Siamo entusiasti di rilasciare un importante aggiornamento a Ideogram 1.0, il nostro modello più avanzato di text-to-image, insieme a diverse nuove funzionalità, tra cui “describe” per la didascalia delle immagini, il prompt negativo e il controllo della qualità e della velocità di rendering delle immagini”, si legge nell’annuncio ufficiale.
“Describe” analizza un’immagine e aiuta a creare le didascalie; “negative prompt” indica al modello quali elementi evitare di generare, mentre i controlli della velocità e del rendering delle immagini bilanciano la qualità dell’output con l’efficienza per coloro che preferiscono generazioni veloci a quelle dettagliate. Quest’ultima caratteristica imita i modelli Turbo e LCM di Stable Difussion.
Questi aggiornamenti hanno però un inconveniente: sono disponibili solo per i clienti paganti. Gli utenti gratuiti avranno accesso al modello, ma saranno limitati a generare fino a 25 batch di 4 immagini ciascuno.
Chi vuole provare queste funzioni può passare al piano “Basic” per 7 dollari al mese o all’opzione “Plus” per 16 dollari. I piani a pagamento danno accesso anche ad altri vantaggi come le generazioni private, il controllo dei semi, le funzionalità di inpainting e le generazioni illimitate in modalità lenta.
La funzione “describe” è un’aggiunta significativa, soprattutto per gli utenti di base. Questo assistente fornisce descrizioni dettagliate di qualsiasi immagine caricata, che possono essere utilizzate per generare richieste più accurate o più descrittive, in modo da corrispondere meglio al riferimento nelle iterazioni successive. Gli utenti possono richiedere descrizioni per qualsiasi immagine presente nel feed di Ideogram o per le proprie immagini caricate da un dispositivo locale.
Ideogram consente ora agli utenti di scegliere tra tre opzioni di rendering: veloce, predefinito e di qualità. La modalità veloce privilegia la velocità e genera immagini in circa cinque secondi, mentre la modalità di qualità privilegia i dettagli più fini e genera immagini in circa 20 secondi.
La funzione di richiesta negativa, invece, amplia le capacità di editing di Ideogram. Questo strumento consente agli utenti di specificare ciò che non vogliono vedere nelle immagini generate, offrendo un maggiore controllo sull’output. È una funzione particolarmente utile per affinare i risultati della generazione di testo-immagine, consentendo di ottenere immagini più accurate e pertinenti al primo colpo.
Infine, Ideogram dichiara di aver migliorato il rendering del testo e il fotorealismo. Il team afferma che l’aggiornamento riduce i tassi di errore del testo di un ulteriore 15% rispetto al modello originale. Ideogram sostiene che i recensori hanno preferito le immagini generate dal modello aggiornato del 30-50% in più rispetto alla versione iniziale.
Il team di Ideogram ha annunciato per la prima volta i miglioramenti il mese scorso durante una sessione di Discord, che ha suscitato un’eco positiva tra la comunità di utenti.
Grazie a questi miglioramenti e ai livelli mensili a pagamento da 7 a 16 dollari, Ideogram è un concorrente forte e conveniente per uno strumento di generazione di immagini. Per fare un confronto, un abbonamento a MidJourney costa tra i 96 e i 1152 dollari all’anno, un abbonamento a ChatGPT Plus – che dà accesso a Dall-E 3- costa 20 dollari al mese, e altri generatori di immagini AI come Leonardo AI e Maze Guru hanno livelli di abbonamento tra i 10 e i 25 dollari.
Per coloro che non sono disposti a pagare per le funzioni premium, invece, l’open-source Stable Diffusion è gratuito e offre funzionalità simili, almeno per gli utenti con computer più potenti.