В течение последних нескольких месяцев компания OpenAI проводила частные испытания новой версии генеративной модели искусственного интеллекта (ИИ), и первые образцы, просочившиеся в Сеть от ютубера MattVidPro, показали, что она превосходит предыдущие генераторы изображений.
«Крайне захватывающе — это превосходит все, что мы видели раньше, просто безумие», — сказал Мэтт в предварительном обзоре, который он разместил на YouTube. «Midjourney не может конкурировать на этом уровне — я даже не думаю, что Midjourney шестой версии сможет конкурировать на этом уровне».
Однако не стоит ожидать, что в ближайшее время вы сможете опробовать эту игру. Доступ к ней крайне ограничен.
Неопубликованная модель, скорее всего, является обновлением DALL-E 2 и тестируется в рамках предварительного просмотра только для приглашенных в ChatGPT-4. По словам Мэтта, всего около 400 человек во всем мире имеют доступ к этому новому генератору изображений OpenAI.
Несмотря на ограниченный объем, образцы изображений демонстрируют продвинутые навыки ИИ. Он создал четкие изображения с освещением и отражениями, имитирующими реальные фотографии. Модель воссоздала детальные картины вплоть до видимых мазков кисти. Она также безупречно воссоздает названия брендов, например «Snickers», и логотипы известных марок, таких как Subway, на сгенерированных продуктах, а также обеспечивает достаточно хорошую орфографию в визуализированном тексте.
В то время как современные генераторы изображений с трудом справляются с задачей создания целостных рук, в примерах были показаны реалистичные, правильно пропорциональные руки. Фоны также выглядели более убедительно, чем у конкурирующих систем ИИ.
Для проверки всех возможностей модели OpenAI, по-видимому, снял защитные фильтры. По словам пользователей, она может без колебаний генерировать материалы с насилием и обнаженную натуру. Однако, зная позицию OpenAI по отношению к NSFW-контенту, маловероятно, что официальная публичная версия будет выпущена по таким стандартам.
«Это OpenAI, так что можно не сомневаться, что перед выпуском они проведут тщательную проверку, как и в случае со всем остальным», — заметил Мэтт.
Некоторые эксперты критикуют OpenAI за «отупление» своих моделей, чтобы избежать возможных разногласий. Некоторые исследования даже предполагают, что OpenAI обучал ChatGPT, чтобы в его результатах присутствовал сильный политический уклон.
Тем не менее, стабильное качество, продемонстрированное в примерах, является большим шагом вперед. Это свидетельствует о постоянных усилиях OpenAI по совершенствованию возможностей генеративного ИИ. Возможно, компания расскажет о своих успехах позже в этом году, особенно если область распознавания и генерации изображений поможет повысить надежность ее главного продукта — мультимодального GPT-4, способного понимать текст, изображения и черновики в одном запросе.
Пока же технология ограничивается закрытым тестированием с небольшим числом пользователей.
По мере совершенствования моделей грань между искусственным и реальным еще больше стирается. И хотя многих это радует, опасения по поводу злоупотреблений сохраняются. Ответственное отношение к созданию этой технологии остается актуальной задачей.