Lo bueno, lo malo y lo feo del chatbot de Elon Musk, Grok.

En el siempre cambiante mundo de la tecnología, rara vez una iniciativa de Elon Musk deja de generar expectación, y semanas después de pedir el fin del cultivo de LLM más capaces que el GPT-4, Musk ha hecho lo de siempre. He aquí xAI, el último invento de Musk, y Grok, el nuevo LLM anunciado el sábado.

¡El anuncio de Grok!

Grok es una inteligencia artificial basada en La Guía del Autoestopista Galáctico que puede responder a cualquier pregunta ¡e incluso decirte qué preguntas hacer!

Grok está diseñado para responder a las preguntas con humor y tiene un lado rebelde, así que no lo uses….

– xAI (@xai) 5 de noviembre de 2023

Esta norma se ha mantenido en secreto. Al menos hasta la semana pasada.

¿Se trata de otro movimiento clásico de Musk que desafía el statu quo, o es solo otro chatbot hinchado que se sube a la ola de popularidad y expectación que rodeó a sus predecesores?

TheGood

Corriente continua de conocimiento en tiempo real

El acceso a todo el flujo de contenidos de Twitter puede convertir a Grok en una herramienta de juego. xAI señala que Grok tiene lo que los investigadores en inteligencia artificial denominan «conocimiento del mundo en tiempo real» mediante el procesamiento de noticias actuales y diversos comentarios. Lo hace de la siguiente manera.

Estudiando los acontecimientos desde distintas perspectivas y tomando notas de la comunidad de Twitter (que se compone esencialmente de comentarios), Grok obtiene una visión del mundo en múltiples capas.

Estudios recientes demuestran que la gente ya está cambiando su comportamiento y busca las noticias en las redes sociales antes de recurrir a los medios tradicionales. La integración de Grok con Twitter acelerará aún más este proceso, proporcionando a los usuarios comentarios oportunos, contexto y, con suerte, hechos sobre el terreno. La xAI señaló que la función de información en tiempo real permite a Grok estar al tanto de los acontecimientos mundiales y responder oportunamente.

Modo fan: hacer realidad el sueño de Elon

La visión de Elon Musk de una inteligencia artificial divertida parece haberse hecho realidad gracias al llamado «modo diversión» de Grok. Esta función permite a la LLM contar chistes, dar respuestas ingeniosas pero correctas y proporcionar a los usuarios una conversación divertida y relajada.

Uno de los retos a los que se enfrentan las plataformas de LLM existentes, como ChatGPT, es que algunos usuarios pueden sentirse demasiado presionados para ser políticamente correctos, lo que puede dar lugar a interacciones menos orgánicas y espontáneas. Además, algunos LLM locales no están dispuestos a mantener conversaciones largas, y Grok promete llenar este vacío con su modo divertido y servir de pasatiempo para aquellos que buscan desconectar.

Grok proporciona información en tiempo real a través de la plataforma ᵔ.

También se basa en la tecnología &amp. ‍♂️ pic.twitter.com/e5OwuGvZ3Z

– Elon Musk (@elonmusk) 4 Nov 2023

El concepto no es exactamente nuevo: Quora ofrece un servicio similar, Poe, que ejecuta chatbots muy afinados, cada uno con su propia personalidad. Sin embargo, la integración de la funcionalidad de Grok con LLM lo lleva al siguiente nivel.

Se necesita acceso a Internet

Una de las características distintivas de Grok es la capacidad de acceder a Internet sin el uso de plug-ins y otros módulos.

El alcance exacto de la funcionalidad del navegador aún está por determinar, pero la idea en sí es atractiva. Imagínese un LLM capaz de mejorar la precisión de los hechos gracias a la capacidad de comparar datos en tiempo real: Grok, junto con el acceso a los contenidos de Twitter, podría revolucionar la forma en que los usuarios interactúan con la inteligencia artificial. Esto se debe a que los usuarios sabrán que la información que reciben no se basa únicamente en los datos de entrenamiento existentes, sino que se actualiza y valida constantemente.

Multitarea

Grok está diseñado como un sistema multitarea que permite a los usuarios mantener varias conversaciones al mismo tiempo. Los usuarios pueden buscar diferentes temas, esperar una respuesta en una conversación y continuar en otra.

El chatbot también es capaz de ramificar las conversaciones, lo que permite a los usuarios profundizar en temas específicos sin interrumpir la discusión principal.

Grok también tiene un editor Markdown integrado, que permite a los usuarios cargar, editar y dar formato a las respuestas de Grok para su uso posterior. Esta herramienta, combinada con la función de bifurcación, permite a los usuarios trabajar en ramas específicas de una conversación y retroceder sin problemas.

La interfaz de usuario de Grok tiene las siguientes características. En primer lugar, es multitarea. Puedes mantener varias conversaciones al mismo tiempo, cambiando de una a otra sobre la marcha. pic.twitter.com/aXAG0M2oPF

– Toby Pohlen (@TobyPhln) 5 Nov 2023

Censura mínima: libertad de expresión AI

La visión Grok de Elon Musk era clara.

Todos los principales chatbots de IA tienen protecciones contra posibles daños o desinformación, pero esto a veces puede ser una limitación: los usuarios han notado que modelos como ChatGPT, Llama y Claude se abstienen de responder para evitar posibles ofensas El usuario es consciente de ello. Sin embargo, esto puede impedir respuestas ofensivas o realmente deseables.

Grok se siente más a gusto respondiendo preguntas, lo que proporciona una comunicación más auténtica y relajada. xAI destaca que, debido a su diseño, Grok puede responder a preguntas significativas que otros sistemas de IA ignorarían

¡Presentamos a Grok!

Grok es una inteligencia artificial galáctica al estilo de una guía del autoestopista que puede responder a casi cualquier pregunta y, aún mejor, ¡puede decirte qué preguntas hacer!

Grok está diseñado para responder a las preguntas con humor y tiene tendencias rebeldes, así que no lo utilices…

– xAI (@xai) 5 de noviembre de 2023

Está claro que la inteligencia artificial ofrece una combinación única de información en tiempo real, humor, precisión y libertad. Sin embargo, como ocurre con cualquier innovación, existen retos y peligros potenciales.

el mal

Crecimiento rápido y aprendizaje limitado

El rápido crecimiento de Grok suscitó preocupación desde el principio: como explicó xAI, «Grok era todavía un producto beta muy incipiente, y dos meses de entrenamiento era todo lo que podíamos hacer»; en el mundo de LLM, dos meses y 33.000 millones de parámetros parecen una gota en el océano.

En comparación, OpenAI es transparente sobre su proceso de desarrollo y afirma que pasó seis meses perfeccionando GPT-4. Esta diferencia en el tiempo de desarrollo sugiere que el desarrollo de Grok se precipitó para aprovechar la ola de la IA.

Además, x.AI no se pronuncia sobre la escala del hardware utilizado para entrenar a Grok, lo que deja margen a la especulación.

Todos los parámetros.
Para los no iniciados, en resumen, el parámetro LLM representa la cantidad de información o conocimiento que el modelo puede almacenar. Refleja la capacidad cerebral real de la inteligencia artificial y determina su capacidad para procesar y generar información. A primera vista, que Grok tenga 33.000 millones de parámetros puede parecer impresionante.

Sin embargo, en el competitivo entorno de los LLM, Grok es sólo uno de los jugadores. De hecho, el número de parámetros puede no ser suficiente para satisfacer los complejos requisitos empresariales y ofrecer los resultados de alta calidad que grandes empresas como ChatGPT, Claude y Bard han establecido como patrón oro.

En parte debido a este reducido número de parámetros, Grok no puede superar a otros modelos tradicionales en importantes pruebas de referencia como HumanEval y MMLU:

Fuente: x.AI
Grok no es particularmente impresionante en esta área, aunque según xAI, grok contiene 8.192 tokens de contexto, GPT-4 soporta 32.000, y Claude soporta otros 100.000 tokens de contexto; el nuevo GPT-4 Turbo de OpenAI alcanza una ventana de contexto de 128.000 tokens

Coste de la innovación

El coste es un factor clave a la hora de evaluar el valor de cualquier producto, y Grok no es una excepción. El chatbot está disponible por una cuota mensual de 16 dólares.

Teniendo en cuenta ofertas gratuitas como Claude 2 y ChatGPT, que se basan en GPT-3.5 Turbo, Grok puede ser difícil de vender. Sobre todo si se tiene en cuenta que estos productos gratuitos están muy bien considerados por su precisión y ya han superado a Grok en algunas pruebas comparativas.

Además, incluso el LLM más potente, el GPT-4, tiene la ventaja de su amplia disponibilidad, multimodalidad y potencia, y promete superar a Grok.

@xAI Grok AI Assistant se ofrece como parte del paquete ᵔ Premium+, se recomienda registrarse.

Sólo 16 $/mes en línea. https://t.co/wEEIZNjEkp

– Elon Musk (@elonmusk) 4 Nov 2023

¿Es la introducción de Grok principalmente un movimiento estratégico para aumentar el número de suscriptores de Twitter Blue y ampliar el flujo de ingresos de Twitter?

Estas preocupaciones ponen de manifiesto la dificultad de convertir a Grok en un actor importante en el mercado de los LLM. Y las deficiencias van más allá del precio.

Ugly

.
Se ha dejado de lado la ficción

Utilizar personajes ficticios de la ficción popular como modelos para los LLM es, sin duda, una solución creativa. El atractivo de los personajes de ficción puede ser atractivo, pero en un mundo cada vez más dependiente de la información fiable, conlleva ciertos riesgos. Los usuarios que acuden a la inteligencia artificial con preguntas y consejos serios pueden dejarse engañar por sistemas que imitan a personajes de dibujos animados.

Como la línea entre ficción y realidad es cada vez más difusa, también existe el riesgo de que los usuarios malinterpreten chistes o respuestas satíricas como información real. En la era digital, donde toda la información se analiza y comparte, las consecuencias de estos malentendidos pueden ser importantes. Esto es especialmente cierto cuando intervienen varios idiomas.

El humor y el ingenio tienen su lugar, pero es importante encontrar un equilibrio, sobre todo cuando los usuarios buscan información importante. Dar prioridad al humor sobre la precisión puede ser divertido, pero también puede socavar la esencia de lo que un LLM debe proporcionar: información fiable.

Sobreprometer y no cumplir

Las grandes promesas de Elon Musk con respecto a Grok eran muy prometedoras. Un análisis más detallado revela una posible contradicción entre el bombo publicitario y la realidad. El hecho de que los métodos tradicionales de aprendizaje LLM estén limitados por los datos de entrenamiento apunta a una limitación fundamental.

Con 33.000 millones de parámetros y sólo unos meses de tiempo de desarrollo, el entrenamiento de Grok parece insignificante en comparación con otros gigantes del LLM. Aunque la idea de crear una personalidad ficticia y divertida suena atractiva, la expectativa de que los métodos de entrenamiento estándar puedan producir resultados revolucionarios puede ser algo exagerada.

La comunidad de la IA está acostumbrada a la hipérbole, pero dados los rápidos avances en este campo, es importante que los usuarios puedan ver más allá de las ilusiones. Alcanzar el estatus de «super IA – es una tarea compleja, y es poco probable que Grok lo consiga con su configuración y entrenamiento actuales.

Para demostrar las capacidades de Grok, Elon Musk comparó su chatbot con un pequeño LLM entrenado en programación. Huelga decir que no fue una pelea justa.

ElonMusk (@elonmusk) 5Nov2023

Grok frente a un ejemplo típico de GPT; Grok tiene información real, el otro no.

Amenaza de desinformación

La MLM es una herramienta poderosa pero no infalible. Sin normas rigurosas, distinguir la realidad de la ficción puede ser extremadamente difícil. La historia reciente ofrece ejemplos aterradores, como los chatbots 4chan, entrenados con datos, y Tay, un chatbot de Microsoft potenciado por Twitter. Estos bots no sólo difunden discursos de odio, sino que también se hacen pasar por personas reales, engañando a multitud de audiencias de Internet.

Esta semana, el sitio web @huggingface publicó un modelo para crear textos ofensivos y discriminatorios AI, que ya ha publicado más de 30.000 comentarios viles en línea (según su autor).

Este experimento nunca pasará la comisión de investigación del cuerpo humano AI A continuación, mis sugerencias.

1/7 https://t.co/tJCegPcFan pic.twitter.com/Mj7WEy2qHl

– Lauren Oakden-Rayner ️ ‍⚧️ (@DrLaurenOR) 6 de junio de 2022

Este coqueteo con la desinformación no es un incidente aislado. La imagen de Twitter se ha deteriorado desde el nombramiento de Elon, lo que podría poner en peligro la capacidad de Glock para ofrecer información precisa de forma constante. Las personas con formación en artes liberales a veces son presa de ilusiones, y cuando estas distorsiones se aceptan como verdad, las consecuencias pueden ser inquietantes.

La posibilidad de desinformación es una bomba de relojería. A medida que los usuarios confían cada vez más en la inteligencia artificial para informarse, la desinformación puede conducir a una mala toma de decisiones. Para ser un aliado de confianza, Glock debe tener cuidado de que sus bromas no eclipsen la verdad.

¿Falta de capacidades multimodales?

En el cambiante mundo de la inteligencia artificial, el enfoque basado en texto de Grok parece una reliquia del pasado. Los usuarios tienen que pagar por los servicios de Grok, pero es natural preguntarse por qué esto es necesario cuando otros LLM ofrecen capacidades multimodales más ricas.

Por ejemplo, GPT-4-v ya ha dado pasos significativos en multimodalidad, permitiendo a los usuarios oír, ver y hablar. El próximo Gemini de Google promete capacidades similares. En este contexto, la oferta de Grok parece bastante deslucida y plantea más dudas sobre su propuesta de valor.

El mercado es muy competitivo y los usuarios cada vez más exigentes; si Grok quiere hacerse un hueco, necesita ofrecer algo realmente único. Con competidores que ofrecen funciones avanzadas y mayor precisión, a menudo gratis, Grok se enfrenta a un reto.
El lanzamiento de Grok fue un éxito.
El lanzamiento de Grok ha generado tanto entusiasmo como escepticismo: el enfoque de producto mínimo viable (MVP) permite una rápida iteración y mejora en función de los comentarios de los usuarios. Sin embargo, la competencia con gigantes de la inteligencia artificial con muchos más recursos es feroz.

Para triunfar, Grok debe ofrecer funciones nuevas y útiles. En un mercado saturado, el valor del entretenimiento por sí solo no basta. A los usuarios de IA no les distraen los memes divertidos sobre perros.

En última instancia, el destino de Grok depende del equilibrio entre innovación y facilidad de uso. Aunque se justifica un sano escepticismo, sería prematuro abandonar por completo la empresa: Grok puede seguir abriendo nuevos caminos, o puede quedarse al margen del desarrollo de la inteligencia artificial. En cualquier caso, los orígenes poco convencionales de Grok garantizan que será un capítulo interesante en la historia de la inteligencia artificial