OpenAI тества частно нова итерация на своя генеративен модел за изображения с изкуствен интелект (AI) през последните няколко месеца и първите проби, изтекли от YouTuber MattVidPro, показват, че той превъзхожда предишните генератори на изображения.
„Изключително вълнуващо – това издухва всичко, което сме виждали досега, това е лудост“, казва Мат в превю, което е публикувал в YouTube. „Midjourney не може да се конкурира на това ниво – дори не мисля, че шестата версия на Midjourney ще може да се конкурира на това ниво.“
Не очаквайте обаче да я изпробвате скоро. Достъпът е изключително ограничен.
Непубликуваният модел вероятно е ъпгрейд на DALL-E 2 и се тества чрез предварителен преглед само за поканени в ChatGPT-4. Мат каза, че има само около 400 души по света, които имат достъп до този нов генератор на изображения на OpenAI.
Макар и ограничени, образците на изображенията демонстрират напредналите умения на изкуствения интелект. Той създава резки изображения с осветление и отражения, които имитират истински снимки. Моделът пресъздава детайлни картини до видими щрихи на четката. Той също така пресъздава безупречно имена на марки като „Snickers“ и лога на известни марки като Subway върху генерирани продукти и постига сравнително добър правопис в изобразения текст.
Въпреки че сегашните генератори на изображения се затрудняват с кохерентните ръце, примерите показват реалистични, правилно пропорционирани ръце. Фонът също изглеждаше по-убедителен от конкурентните системи с изкуствен интелект.
OpenAI очевидно е премахнала своите филтри за безопасност, за да изпробва пълния потенциал на модела. Потребителите твърдят, че той може да генерира съдържание с насилие и голота без колебание. Въпреки това, познавайки позицията на OpenAI спрямо NSFW съдържанието, е малко вероятно официалната публична версия да бъде пусната при такива стандарти.
„Това е OpenAI, така че можете да се обзаложите, че те ще се погрижат за това нещо, както правят за всичко, преди да го пуснат“, отбеляза Мат.
Някои експерти критикуваха OpenAI, че „затъпява“ моделите си, за да избегне потенциални спорове. Някои проучвания дори предполагат, че OpenAI е обучила ChatGPT да има силна политическа пристрастност в резултатите си.
Независимо от това, постоянното качество, показано в извадките, е крачка напред. То подчертава продължаващите усилия на OpenAI за подобряване на възможностите на генеративния изкуствен интелект. Компанията може да разкрие повече за напредъка си по-късно тази година, особено ако областта на разпознаване и генериране на изображения помогне за подобряване на стабилността на нейния звезден продукт: мултимодален GPT-4, способен да разбира текст, изображения и проекти в един подкана.
Засега технологията остава ограничена до затворени тестове с незначителен брой потребители.
С по-нататъшното усъвършенстване на моделите границата между изкуствено и реално се размива още повече. Макар това да вълнува мнозина, опасенията за злоупотреба ще продължат да съществуват. Създаването на тази технология по отговорен начин остава спешно предизвикателство.