Хороший, плохой и уродливый чатбот Элона Маска, Grok.

В постоянно меняющемся мире технологий редко какая инициатива Элона Маска не вызывает ажиотажа, и спустя несколько недель после призыва прекратить выращивание LLM, более способных, чем GPT-4, Маск поступил как обычно. Вот xAI, последнее изобретение Маска, и Grok, новый LLM, анонсированный в субботу.

Анонс Grok!

Grok — это искусственный интеллект, созданный по мотивам «Путеводителя автостопщика по Галактике», который может ответить на любой вопрос и даже подсказать, какие вопросы следует задать!

Grok создан, чтобы отвечать на вопросы с юмором и имеет бунтарскую сторону, так что не используйте….

— xAI (@xai) 5 ноября 2023 года

Это правило держалось в секрете. По крайней мере, до прошлой недели.

Является ли это еще одним классическим шагом Маска, бросающим вызов статус-кво, или это просто еще один раздутый чатбот, оседлавший волну популярности и шумихи, которая окружала его предшественников?

TheGood

Непрерывный поток знаний в реальном времени

Доступ ко всему потоку контента Twitter может сделать Grok игровым инструментом. xAI отмечает, что Grok обладает тем, что исследователи искусственного интеллекта называют обратной связью с обучением с подкреплением (RLHF), «знаниями о мире в реальном времени», обрабатывая текущие новости и различные комментарии. Делается это следующим образом.

Изучая события с разных точек зрения и делая заметки из сообщества Twitter (которое, по сути, состоит из комментариев), Grok получает многослойное представление о мире.

Последние исследования показывают, что люди уже меняют свое поведение и ищут новости в социальных сетях, прежде чем обратиться к традиционным СМИ. Интеграция Grok с Twitter еще больше ускорит этот процесс, обеспечивая пользователей оперативными комментариями, контекстом и, надеюсь, фактами с места событий. В xAI отметили, что функция получения информации в режиме реального времени позволяет Grok быть в курсе глобальных событий и своевременно реагировать на них.

Fan mode: воплощение мечты Элона

Видение Элона Маска о веселом искусственном интеллекте, похоже, воплотилось в жизнь благодаря так называемому «режиму веселья» Grok. Эта функция позволяет LLM рассказывать анекдоты, давать остроумные, но корректные ответы и обеспечивать пользователям веселую и непринужденную беседу.

Одна из проблем, с которой сталкиваются существующие платформы для LLM, такие как ChatGPT, заключается в том, что некоторые пользователи могут ощущать чрезмерное давление с целью обеспечения политкорректности, что может привести к менее органичному и спонтанному взаимодействию. Кроме того, некоторые локальные LLM не располагают к длительному общению, и Grok обещает восполнить этот пробел за счет своего веселого режима и послужить увлекательным времяпрепровождением для тех, кто хочет расслабиться.

Grok предоставляет информацию в режиме реального времени через платформу ᵔ.

Она также основана на технологии &amp. ‍♂️ pic.twitter.com/e5OwuGvZ3Z

— Elon Musk (@elonmusk) 4 ноября 2023 года

Концепция не совсем нова — аналогичный сервис предлагает компания Quora — Poe, в котором работают тонко настроенные чат-боты, каждый из которых обладает собственной индивидуальностью. Однако интеграция функциональности Grok с LLM позволяет выйти на новый уровень.

Необходимый доступ в Интернет

Одной из отличительных особенностей Grok является возможность выхода в Интернет без использования плагинов и других модулей.

Точный объем функциональных возможностей браузера еще предстоит определить, но сама идея привлекательна. Представьте себе LLM, который может повысить точность фактов благодаря возможности сравнения данных в реальном времени — Grok, наряду с доступом к контенту Twitter, может произвести революцию во взаимодействии пользователей с искусственным интеллектом. Это связано с тем, что пользователи будут знать, что получаемая ими информация не просто основана на существующих обучающих данных, а постоянно обновляется и проверяется.

Многозадачность

Grok разработан как многозадачная система, позволяющая пользователям вести несколько разговоров одновременно. Пользователи могут искать различные темы, ждать ответа в одном разговоре и продолжать его в другом.

Чатбот также способен разветвлять беседы, позволяя пользователям углубляться в конкретные темы, не прерывая основное обсуждение.

В Grok также встроен редактор Markdown, позволяющий пользователям загружать, редактировать и форматировать ответы Grok для последующего использования. Этот инструмент в сочетании с функцией разветвления позволяет пользователям работать над определенными ветвями беседы и плавно возвращаться назад.

Пользовательский интерфейс Grok обладает следующими особенностями. Во-первых, это многозадачность. Вы можете вести несколько разговоров одновременно, переключаясь между ними по ходу дела. pic.twitter.com/aXAG0M2oPF

— Toby Pohlen (@TobyPhln) 5 Nov 2023

Минимум цензуры: свобода слова AI

Видение Grok Элона Маска было ясным.

Все основные чат-боты с искусственным интеллектом имеют средства защиты от возможного вреда или дезинформации, но иногда это может быть ограничением: пользователи заметили, что такие модели, как ChatGPT, Llama и Claude, воздерживаются от ответов, чтобы избежать потенциальной обиды Пользователь знает об этом. Однако это может исключить оскорбительные или действительно желательные ответы.

Grok более непринужденно отвечает на вопросы, обеспечивая более аутентичное и непринужденное общение. xAI подчеркивает, что благодаря своей конструкции Grok может отвечать на содержательные вопросы, которые другие системы искусственного интеллекта проигнорировали бы

Представляем Grok!

Grok — это галактический искусственный интеллект в стиле путеводителя автостопщика, который может ответить практически на все вопросы и, что еще лучше, может подсказать, какие вопросы следует задать!

Грок создан для того, чтобы отвечать на вопросы с юмором и имеет бунтарские наклонности, поэтому не используйте его…

— xAI (@xai) 5 ноября 2023 года

Очевидно, что искусственный интеллект предлагает уникальное сочетание информации в реальном времени, юмора, точности и свободы. Однако, как и в случае с любой инновацией, здесь есть свои сложности и потенциальные «подводные камни».

злой

Быстрый рост и ограниченное обучение

Быстрый рост Grok с самого начала вызывал опасения: как пояснили в xAI, «Grok был еще очень ранним бета-продуктом, и два месяца обучения — это все, что мы могли сделать»; в мире LLM два месяца и 33 млрд. параметров кажутся каплей в море.

Для сравнения, OpenAI прозрачно описывает процесс разработки, заявляя, что потратил шесть месяцев на доработку GPT-4. Такая разница в сроках разработки наводит на мысль, что разработка Grok велась в спешке, чтобы успеть воспользоваться волной ИИ.

Кроме того, x.AI умалчивает о масштабах аппаратного обеспечения, использованного для обучения Grok, оставляя место для спекуляций.
Все параметры

Для непосвященных, вкратце, параметр LLM представляет собой объем информации или знаний, которые может хранить модель. Он отражает реальную емкость мозга искусственного интеллекта и определяет его способность обрабатывать и генерировать информацию. На первый взгляд, Grok, имеющий 33 млрд. параметров, может показаться впечатляющим.

Однако в конкурентной среде LLM Grok — это всего лишь один из игроков. На самом деле, количество параметров может оказаться недостаточным для удовлетворения сложных бизнес-требований и получения высококачественных результатов, которые такие крупные компании, как ChatGPT, Claude и Bard, установили в качестве золотого стандарта.

Отчасти из-за такого уменьшенного количества параметров Grok не может превзойти другие традиционные модели в основных эталонных тестах, таких как HumanEval и MMLU:

Источник: x.AI
Grok не особенно впечатляет в этой области, хотя, по данным xAI, grok содержит 8 192 контекстных токенов, GPT-4 поддерживает 32 000, а Claude — еще 100 000 контекстных токенов; новый GPT-4 Turbo OpenAI достигает контекстного окна в 128 000 токенов

Стоимость инноваций

Стоимость — ключевой фактор при оценке ценности любого продукта, и Grok не является исключением. Чатбот доступен за ежемесячную плату в размере 16 долларов США.

Учитывая такие бесплатные предложения, как Claude 2 и ChatGPT, которые основаны на GPT-3.5 Turbo, Grok может быть трудно продать. Особенно если учесть, что эти бесплатные модели высоко ценятся за свою точность и уже превзошли Grok в некоторых эталонных тестах.

Более того, даже самая мощная LLM, GPT-4, имеет преимущество в виде широкой доступности, мультимодальности и мощности, и обещает превзойти Grok.

.

@xAI Grok AI Assistant предлагается в рамках пакета ᵔ Premium+, рекомендуется регистрация.

Всего $16 в месяц в режиме онлайн. https://t.co/wEEIZNjEkp

— Элон Маск (@elonmusk) 4 ноября 2023

Является ли внедрение Grok в первую очередь стратегическим шагом, направленным на увеличение числа подписчиков Twitter Blue и расширение потока доходов Twitter?

Эти опасения подчеркивают сложность превращения Grok в крупного игрока на рынке LLM. Причем недостатки выходят за рамки цены.

Ugly

Fiction has been left out

Использование вымышленных персонажей из популярной художественной литературы в качестве моделей для LLM — это, несомненно, творческое решение. Привлекательность вымышленных персонажей может быть привлекательной, однако в мире, который все больше зависит от достоверной информации, она несет в себе определенные риски. Пользователи, обращающиеся к искусственному интеллекту с серьезными вопросами и советами, могут быть обмануты системами, имитирующими мультяшных персонажей.

Поскольку грань между вымыслом и реальностью становится все более размытой, существует также риск того, что пользователи могут неправильно интерпретировать шутки или сатирические ответы как реальную информацию. В эпоху цифровых технологий, когда вся информация анализируется и распространяется, последствия такого недопонимания могут быть весьма значительными. Это особенно актуально, когда речь идет о нескольких языках.

Юмор и остроумие имеют свое место, но важно соблюдать баланс, особенно когда пользователи ищут важную информацию. Приоритет юмора над точностью может быть забавным, но он также может подорвать суть того, что должен предоставлять LLM — достоверную информацию.

Overpromise and underdeliver

Большие обещания Элона Маска в отношении Grok были очень многообещающими. При ближайшем рассмотрении обнаруживается потенциальное противоречие между шумихой и реальностью. Тот факт, что традиционные методы обучения LLM ограничены обучающими данными, указывает на фундаментальное ограничение.

При 33 миллиардах параметров и всего нескольких месяцах разработки обучение Grok кажется незначительным по сравнению с другими гигантами LLM. Хотя идея создания забавной, вымышленной личности звучит привлекательно, ожидания того, что стандартные методы обучения могут дать революционные результаты, могут быть несколько преувеличены.

ИИ-сообщество привыкло к гиперболам, но, учитывая стремительный прогресс в этой области, важно, чтобы пользователи могли видеть за иллюзиями нечто большее. Достижение статуса «супер ИИ» — сложная задача, и Grok вряд ли сможет ее решить при нынешней конфигурации и обучении.

Чтобы продемонстрировать возможности Grok, Элон Маск сравнил своего чатбота с небольшим LLM, обученным программированию. Не стоит говорить, что это была нечестная борьба.

ElonMusk (@elonmusk) 5Nov2023

Грок против типичного примера GPT; у Грока есть реальная информация, у другого — нет.

Угроза дезинформации

MLM — мощный, но не непогрешимый инструмент. Без строгих стандартов отличить факт от вымысла бывает крайне сложно. Недавняя история дает пугающие примеры, такие как чат-боты 4chan, обученные данным, и Tay, чат-бот компании Microsoft, наделенный правом общаться в Twitter. Эти боты не только распространяют ненавистнические высказывания, но и выдают себя за реальных людей, вводя в заблуждение множество интернет-аудитории.

На этой неделе на сайте @huggingface была опубликована модель создания оскорбительных и дискриминационных текстов AI, которая уже разместила в сети более 30 тыс. мерзких комментариев (по словам ее автора).

Этот эксперимент никогда не пройдет комиссию по исследованию человеческого тела. Ниже приведены мои предложения.

1/7 https://t.co/tJCegPcFan pic.twitter.com/Mj7WEy2qHl

— Lauren Oakden-Rayner ️ ‍⚧️ (@DrLaurenOR) 6 июня 2022

Это заигрывание с дезинформацией не является единичным случаем. Имидж Twitter ухудшился после назначения Элона, что может поставить под угрозу способность Глока предоставлять стабильно достоверную информацию. Люди с гуманитарным образованием иногда становятся жертвами иллюзий, и когда эти искажения воспринимаются как истина, последствия могут быть тревожными.

Возможность дезинформации — это бомба замедленного действия. Поскольку пользователи все больше полагаются на искусственный интеллект при получении информации, дезинформация может привести к принятию неверных решений. Чтобы быть надежным союзником, Glock должен быть осторожен и следить за тем, чтобы его шутки не затмевали правду.

Недостаток мультимодальных возможностей?

В развивающемся мире искусственного интеллекта текстовый подход Grok кажется пережитком прошлого. Пользователям приходится платить за услуги Grok, но вполне естественно задаться вопросом, зачем это нужно, если другие LLM предлагают более богатые мультимодальные возможности.

Например, GPT-4-v уже добился значительных успехов в области мультимодальности, позволяя пользователям слышать, видеть и говорить. Готовящийся к выпуску Gemini компании Google обещает аналогичные возможности. В этом контексте предложение Grok выглядит довольно неубедительным и вызывает больше вопросов относительно его ценностного предложения.

Рынок высококонкурентен, а пользователи становятся все более требовательными; если Grok хочет занять свою нишу, она должна предложить что-то действительно уникальное. Учитывая, что конкуренты предлагают расширенные возможности и более высокую точность, причем зачастую бесплатно, перед Grok стоит непростая задача.
Запуск Grok прошел успешно.
Запуск Grok вызвал не только энтузиазм, но и скептицизм: подход, основанный на минимальном жизнеспособном продукте (MVP), позволяет быстро итерировать и улучшать продукт на основе отзывов пользователей. Однако конкуренция с гигантами искусственного интеллекта, обладающими гораздо большими ресурсами, очень жесткая.

Чтобы добиться успеха, Grok должен предлагать новые и полезные функции. В условиях переполненного рынка одной лишь развлекательной ценности недостаточно. Пользователи ИИ не отвлекаются на смешные мемы о собаках.

В конечном счете, судьба Grok зависит от баланса между инновациями и простотой использования. Хотя здоровый скептицизм вполне оправдан, полностью отказываться от компании было бы преждевременно: Grok может продолжать открывать новые горизонты, а может и остаться в стороне от развития искусственного интеллекта. В любом случае, нестандартное происхождение Grok гарантирует, что она станет интересной главой в истории искусственного интеллекта