Ideogram, ein KI-Bildgenerator, der von ehemaligen Google-Ingenieuren entwickelt wurde, hat seine erste Reihe von Upgrades veröffentlicht, die die Plattform funktioneller und benutzerfreundlicher machen sollen. Die Upgrades fügen Funktionen hinzu, die besser zu den Angeboten von Stable Diffusion und Midjourney passen, und das zu einem überzeugenden Preis.
Die erste öffentliche Version von Ideogram im Februar wurde unter KI-Enthusiasten schnell als starke und leistungsfähige Alternative zu Midjourney, Dall-E 3 und Stable Diffusion bekannt. Tests von TCN ergaben, dass Ideogram im Vergleich zu anderen populären Bildgeneratoren in Bezug auf das Verständnis von Eingabeaufforderungen, die Fähigkeit zur Texterstellung, das räumliche Vorstellungsvermögen, die Einhaltung von Eingabeaufforderungen, die Vielfalt der Stile, die Erstellung von Personen und Marken sowie die Gesamtqualität überragend ist.
„Wir freuen uns, ein großes Upgrade für Ideogram 1.0, unser fortschrittlichstes Text-zu-Bild-Modell, zusammen mit mehreren neuen Funktionen, einschließlich ‚describe‘ für Bildunterschriften, negative Prompts sowie Qualitäts- und Geschwindigkeitskontrolle für die Bildwiedergabe, zu veröffentlichen“, heißt es in der offiziellen Ankündigung.
„Describe“ analysiert ein Bild und hilft bei der Beschriftung; „Negative Prompt“ teilt dem Modell mit, welche Elemente nicht generiert werden sollen, und die Bildrendering- und Geschwindigkeitssteuerung sorgt für ein Gleichgewicht zwischen Ausgabequalität und Effizienz für diejenigen, die schnelle Generierungen detaillierten vorziehen. Die letztgenannte Funktion ähnelt den Turbo- und LCM-Modellen von Stable Difussion.
Diese Upgrades haben jedoch einen Haken: Sie sind nur für zahlende Kunden verfügbar. Kostenlose Nutzer haben Zugriff auf das Modell, können aber nur bis zu 25 Stapel von jeweils 4 Bildern erzeugen.
Diejenigen, die diese Funktionen ausprobieren möchten, können ein Upgrade auf den „Basic“-Tarif für 7 $ pro Monat oder die „Plus“-Option für 16 $ vornehmen. Die kostenpflichtigen Tarife geben den Nutzern auch Zugang zu anderen Vorteilen wie private Generationen, Seed-Kontrolle, Inpainting-Funktionen und unbegrenzte Generationen im langsamen Modus.
Die Beschreibungsfunktion ist eine wichtige Ergänzung, vor allem für einfache Nutzer. Dieser Assistent liefert detaillierte Beschreibungen zu jedem hochgeladenen Bild, die dann verwendet werden können, um genauere oder aussagekräftigere Aufforderungen zu generieren, um die Referenz in nachfolgenden Iterationen besser zu treffen. Nutzer können Beschreibungen für jedes Bild im Ideogram-Feed oder für ihre eigenen, von einem lokalen Gerät hochgeladenen Bilder anfordern.
Ideogram ermöglicht es Nutzern nun auch, zwischen drei Rendering-Optionen zu wechseln: Schnell, Standard und Qualität. Der schnelle Modus legt den Schwerpunkt auf Geschwindigkeit und erzeugt Bilder in etwa fünf Sekunden, während der Qualitätsmodus feinere Details bevorzugt und Bilder in etwa 20 Sekunden erzeugt.
Die Funktion der negativen Eingabeaufforderung erweitert die Bearbeitungsmöglichkeiten von Ideogram. Mit diesem Werkzeug können Benutzer angeben, was sie in den erzeugten Bildern nicht sehen wollen, und so mehr Kontrolle über die Ausgabe haben. Diese Funktion ist besonders nützlich, um die Ergebnisse der Text-zu-Bild-Generierung zu verfeinern, so dass bereits bei der ersten Aufnahme genauere und relevantere Bilder entstehen.
Schließlich gibt Ideogram an, dass es die Textdarstellung und den Fotorealismus verbessert hat. Das Team sagt, dass das Upgrade die Textfehlerrate um weitere 15 % im Vergleich zum ursprünglichen Modell reduziert. Ideogram behauptet, dass Rezensenten die mit dem verbesserten Modell erzeugten Bilder um 30-50% mehr bevorzugten als die ursprüngliche Version.
Das Ideogram-Team kündigte die Verbesserungen erstmals im vergangenen Monat während einer Discord-Sitzung an, die in der Nutzergemeinschaft bereits für positive Resonanz sorgte.
Mit diesen Verbesserungen und den monatlichen Gebühren von $7 bis $16 ist Ideogram ein starker und kostengünstiger Konkurrent für ein KI-Tool zur Bilderzeugung. Zum Vergleich: Ein MidJourney-Abonnement kostet zwischen $96 und $1152 pro Jahr, ein ChatGPT Plus-Abonnement, das Zugang zu Dall-E 3 bietet, kostet $20 pro Monat, und andere KI-Bildgeneratoren wie Leonardo AI und Maze Guru haben Abonnementstufen zwischen $10 und $25.
Für diejenigen, die nicht bereit sind, für Premium-Funktionen zu zahlen, ist das Open-Source-Programm Stable Diffusion kostenlos und bietet ähnliche Funktionen, zumindest für Benutzer mit leistungsfähigeren Computern.