OpenAI prywatnie testowało nową iterację swojego generatywnego modelu obrazowania sztucznej inteligencji (AI) w ciągu ostatnich kilku miesięcy, a wczesne próbki wyciekły przez YouTubera MattVidPro pokazują, że przewyższa on poprzednie generatory obrazu.
„Niezwykle ekscytujące – to wysadza z wody wszystko, co widzieliśmy wcześniej, to szaleństwo” – powiedział Matt w podglądzie, który opublikował na YouTube. „Midjourney nie może konkurować na tym poziomie – nie sądzę nawet, by Midjourney w wersji szóstej był w stanie konkurować na tym poziomie”.
Nie spodziewaj się jednak, że wypróbujesz go w najbliższym czasie. Dostęp jest bardzo ograniczony.
Nieopublikowany model jest prawdopodobnie aktualizacją DALL-E 2 i jest testowany w ramach podglądu tylko dla zaproszonych w ChatGPT-4. Matt powiedział, że tylko około 400 osób na całym świecie ma dostęp do tego nowego generatora obrazu OpenAI.
Próbki obrazu, choć ograniczone, demonstrują zaawansowane umiejętności sztucznej inteligencji. Tworzyła ostre obrazy z oświetleniem i odbiciami, które naśladowały prawdziwe zdjęcia. Model odtworzył szczegółowe obrazy aż do widocznych pociągnięć pędzla. Odtworzył również nazwy marek, takie jak „Snickers” i logo znanych marek, takich jak Subway, bezbłędnie na wygenerowanych produktach i osiągnął dość dobrą pisownię w renderowanym tekście.
Podczas gdy obecne generatory obrazu zmagają się ze spójnymi dłońmi, przykłady pokazały realistyczne, odpowiednio proporcjonalne dłonie. Tła również wyglądały bardziej przekonująco niż w konkurencyjnych systemach AI.
OpenAI najwyraźniej usunęło filtry bezpieczeństwa, aby przetestować pełny potencjał modelu. Użytkownicy stwierdzili, że może on bez wahania generować brutalne treści i nagość. Jednak znając stanowisko OpenAI wobec treści NSFW, jest bardzo mało prawdopodobne, aby oficjalna wersja publiczna została wydana zgodnie z takimi standardami.
„To OpenAI, więc możesz się założyć, że będą niańczyć tę rzecz, tak jak robią to ze wszystkim, zanim ją wydadzą” – zauważył Matt.
Niektórzy eksperci krytykują OpenAI za „ogłupianie” swoich modeli w celu uniknięcia potencjalnych kontrowersji. Niektóre badania sugerują nawet, że OpenAI wyszkolił ChatGPT, aby miał silne uprzedzenia polityczne w swoich wynikach.
Niemniej jednak, spójna jakość pokazana w próbkach jest krokiem naprzód. Podkreśla to ciągłe wysiłki OpenAI w celu poprawy możliwości generatywnej sztucznej inteligencji. Firma może ujawnić więcej informacji na temat swoich postępów jeszcze w tym roku, zwłaszcza jeśli dziedzina rozpoznawania i generowania obrazów pomoże poprawić solidność jej głównego produktu: multimodalnego GPT-4 zdolnego do rozumienia tekstu, obrazów i szkiców w jednym podpowiedzi.
Na razie technologia ta pozostaje ograniczona do zamkniętych testów z niewielką liczbą użytkowników.
Wraz z ciągłym doskonaleniem modeli, granica między sztucznym a rzeczywistym zaciera się jeszcze bardziej. Chociaż wielu to ekscytuje, obawy dotyczące niewłaściwego użycia będą się utrzymywać. Odpowiedzialne budowanie tej technologii pozostaje pilnym wyzwaniem.