Ideogram, generator obrazów AI stworzony przez byłych inżynierów Google, wydał swój pierwszy zestaw aktualizacji mających na celu zwiększenie funkcjonalności i użyteczności platformy. Uaktualnienia dodają możliwości, aby lepiej dopasować się do ofert Stable Diffusion i Midjourney w atrakcyjnej cenie.
Pierwsze publiczne wydanie Ideogram w lutym szybko zyskało popularność wśród entuzjastów sztucznej inteligencji jako silna i wydajna alternatywa dla Midjourney, Dall-E 3 i Stable Diffusion. Testy przeprowadzone przez TCN wykazały, że wyróżniał się on pod względem szybkiego zrozumienia, możliwości generowania tekstu, świadomości przestrzennej, szybkiej zgodności, różnorodności stylów, generowania osób i marek oraz ogólnej jakości w porównaniu z innymi popularnymi generatorami obrazów.
„Cieszymy się, że możemy wydać dużą aktualizację do Ideogram 1.0, naszego najbardziej zaawansowanego modelu zamiany tekstu na obraz, wraz z kilkoma nowymi funkcjami, w tym „opisem” do podpisywania obrazów, negatywną podpowiedzią oraz kontrolą jakości i szybkości renderowania obrazu” – czytamy w oficjalnym komunikacie.
Funkcja „Describe” analizuje obraz i pomaga w tworzeniu podpisów; „negative prompt” informuje model, których elementów należy unikać, a kontrola jakości i szybkości renderowania obrazu równoważy jakość wyjściową z wydajnością dla tych, którzy wolą szybkie generacje od szczegółowych. Ta ostatnia funkcja naśladuje modele Turbo i LCM firmy Stable Difussion.
Te aktualizacje mają jednak pewien haczyk: są dostępne tylko dla płacących klientów. Darmowi użytkownicy będą mieli dostęp do modelu, ale będą ograniczeni do generowania do 25 partii po 4 obrazy każda.
Ci, którzy chcą wypróbować te funkcje, mogą przejść na plan „Basic” za 7 USD miesięcznie lub opcję „Plus” za 16 USD. Płatne plany dają również użytkownikom dostęp do innych korzyści, takich jak prywatne generacje, kontrola nasion, możliwości malowania i nieograniczone generacje w trybie powolnym.
Funkcja „describe” jest istotnym dodatkiem, zwłaszcza dla podstawowych użytkowników. Asystent ten zapewnia szczegółowe opisy każdego przesłanego obrazu, które można następnie wykorzystać do generowania dokładniejszych lub bardziej opisowych podpowiedzi, aby lepiej dopasować odniesienie w kolejnych iteracjach. Użytkownicy mogą poprosić o opisy dla dowolnego obrazu w kanale Ideogram lub własnych obrazów przesłanych z urządzenia lokalnego.
Ideogram pozwala teraz również użytkownikom przełączać się między trzema opcjami renderowania: szybkim, domyślnym i wysokiej jakości. Tryb szybki nadaje priorytet szybkości i generuje obrazy w około pięć sekund, podczas gdy tryb jakości nadaje priorytet drobniejszym szczegółom i generuje obrazy w około 20 sekund.
W międzyczasie funkcja podpowiedzi negatywnej rozszerza możliwości edycji Ideogramu. Narzędzie to pozwala użytkownikom określić, czego nie chcą widzieć w generowanych obrazach, zapewniając większą kontrolę nad wynikami. Jest to szczególnie przydatna funkcja do udoskonalania wyników generowania tekstu na obraz, umożliwiając dokładniejsze i bardziej odpowiednie obrazy w pierwszym ujęciu.
Wreszcie, Ideogram twierdzi, że poprawił renderowanie tekstu i fotorealizm. Zespół twierdzi, że aktualizacja zmniejsza liczbę błędów tekstowych o dodatkowe 15% w porównaniu do oryginalnego modelu. Ideogram twierdzi, że recenzenci preferowali obrazy generowane przez ulepszony model o 30-50% bardziej niż oryginalne, początkowe wydanie.
Zespół Ideogram po raz pierwszy ogłosił ulepszenia w zeszłym miesiącu podczas sesji Discord, która zbudowała wczesny pozytywny szum wśród społeczności użytkowników.
Dzięki tym ulepszeniom i płatnym miesięcznym poziomom od 7 do 16 USD, Ideogram jest silnym i opłacalnym konkurentem dla narzędzia AI do generowania obrazów. Dla porównania, subskrypcja MidJourney kosztuje od 96 do 1152 USD rocznie, subskrypcja ChatGPT Plus – która daje dostęp do Dall-E 3- kosztuje 20 USD miesięcznie, a inne generatory obrazów AI, takie jak Leonardo AI i Maze Guru, mają poziomy subskrypcji od 10 do 25 USD.
Dla tych, którzy nie chcą płacić za funkcje premium, open-source’owy Stable Diffusion jest darmowy i oferuje podobne funkcje, przynajmniej dla użytkowników z mocniejszymi komputerami.