Home » O bom, mau e feio chatbot de Elon Musk, Grok.

O bom, mau e feio chatbot de Elon Musk, Grok.

by Patricia

No mundo da tecnologia, em constante mudança, é raro que uma iniciativa de Elon Musk não cause agitação e, algumas semanas depois de ter apelado ao fim do cultivo de LLMs mais capazes do que o GPT-4, Musk fez o habitual. Eis o xAI, a mais recente invenção de Musk, e Grok, o novo LLM anunciado no sábado.

A regra foi mantida em segredo. Pelo menos até à semana passada.

Será esta mais uma jogada clássica de Musk para desafiar o status quo, ou será apenas mais um chatbot exagerado, aproveitando a onda de popularidade e hype que rodeou os seus antecessores?

TheGood

Fluxo contínuo de conhecimento em tempo real

O acesso a todo o fluxo de conteúdo do Twitter pode fazer do Grok um fator de mudança. A xAI salienta que a Grok tem aquilo a que os investigadores de inteligência artificial chamam feedback de aprendizagem por reforço (RLHF) “conhecimento do mundo em tempo real”, processando notícias actuais e vários comentários. Isso é feito da seguinte forma.

Ao aprender sobre os eventos a partir de diferentes pontos de vista e ao tomar notas da comunidade do Twitter (que consiste essencialmente em comentários), a Grok beneficiará de uma visão do mundo em várias camadas.

Pesquisas recentes mostram que as pessoas já estão a mudar o seu comportamento, passando a procurar notícias nas redes sociais antes de recorrerem aos meios de comunicação tradicionais. A integração da Grok com o Twitter irá acelerar ainda mais este processo, fornecendo aos utilizadores comentários e contexto imediatos e, esperemos, factos no terreno. A xAI observou que a funcionalidade de conhecimento em tempo real permite à Grok manter-se a par dos acontecimentos globais e fornecer respostas oportunas e relevantes.

Modo fã: um sonho tornado realidade para Elon

A visão de Elon Musk de uma inteligência artificial que gosta de se divertir parece estar a concretizar-se com o chamado “modo de diversão” do Grok. Esta funcionalidade permite que o LLM conte piadas, dê respostas espirituosas mas correctas e proporcione aos utilizadores uma experiência de conversação divertida e casual.

Um dos desafios colocados pelas plataformas de LLM existentes, como o ChatGPT, é que alguns utilizadores podem sentir-se excessivamente pressionados para garantir a correção política, o que pode resultar em interacções menos orgânicas e espontâneas. Além disso, alguns LLMs locais não se prestam a uma interação prolongada e o Grok promete colmatar esta lacuna com o seu modo divertido e servir de passatempo imersivo para quem quer descontrair.

O conceito não é totalmente novo – o Poe do Quora oferece um serviço semelhante com chatbots bem afinados, cada um com a sua própria personalidade. No entanto, ao integrar a funcionalidade da Grok com o LLM, a experiência atinge um novo nível.

Acesso nativo à Internet

Um dos outros diferenciais do Grok é a capacidade de aceder à Internet sem a necessidade de plug-ins ou outros módulos.

O âmbito exato da funcionalidade de navegação ainda não foi determinado, mas a ideia é atraente. Imagine um LLM que pode melhorar a precisão factual com a capacidade de comparar dados em tempo real – o Grok, juntamente com o acesso ao conteúdo do Twitter, poderia revolucionar a forma como os utilizadores interagem com a inteligência artificial. Isto porque os utilizadores saberão que a informação que recebem não se baseia apenas em dados de treino existentes, mas é constantemente actualizada e verificada.

Multitarefas

O

Grok foi concebido para ser multitarefa, permitindo aos utilizadores ter várias conversas ao mesmo tempo. Os utilizadores podem pesquisar diferentes tópicos, esperar por uma resposta numa conversa e continuar noutra.

O chatbot também tem a capacidade de ramificar conversas, permitindo que os utilizadores se aprofundem em áreas específicas sem interromper a discussão principal.

O Grok também fornece um editor Markdown integrado, permitindo aos utilizadores descarregar, editar e formatar as respostas do Grok para utilização posterior. Esta ferramenta, combinada com a função de ramificação, permite que os utilizadores trabalhem em ramos específicos da conversa e voltem atrás sem problemas.

Censura mínima: liberdade de expressão AI

A visão do Grok de Elon Musk era clara.

Todos os principais chatbots de IA têm salvaguardas para evitar potenciais danos ou desinformação, mas por vezes isto pode ser uma limitação: os utilizadores notaram que modelos como o ChatGPT, o Llama e o Claude retêm respostas para evitar potenciais ofensas O utilizador está ciente disso. No entanto, isto pode excluir respostas inofensivas ou genuinamente desejáveis.

A Grok é mais casual nas suas respostas, proporcionando uma experiência de conversação mais autêntica e casual. A xAI salienta que, devido à sua conceção, a Grok pode responder a perguntas significativas que outros sistemas de inteligência artificial ignorariam

É evidente que esta inteligência artificial oferece uma combinação única de informação em tempo real, humor, precisão e liberdade. No entanto, como acontece com qualquer inovação, há desafios e potenciais armadilhas a considerar.

evil

Crescimento rápido e formação limitada

O rápido crescimento do Grok levantou algumas preocupações desde o início: como a xAI explicou, “o Grok era ainda um produto beta muito inicial e dois meses de formação era tudo o que podíamos fazer”; no mundo do LLM, dois meses e 33 mil milhões de parâmetros parecem uma gota no oceano.

Em comparação, a OpenAI é transparente quanto ao seu processo de desenvolvimento, afirmando que passou seis meses a afinar o GPT-4. Esta diferença no tempo de desenvolvimento sugere que o desenvolvimento do Grok foi apressado para aproveitar a onda da IA.

Para além disso, a x.AI não se pronuncia sobre a extensão do hardware utilizado para treinar o Grok, deixando espaço para a especulação.
Todos os parâmetros

Para os não iniciados, em resumo, o parâmetro LLM representa a quantidade de informação ou conhecimento que o modelo pode armazenar. Representa a capacidade real do cérebro da inteligência artificial e determina a sua capacidade de processar e gerar informações. Com 33 mil milhões de parâmetros, o Grok pode parecer impressionante à primeira vista.

No entanto, num ambiente competitivo de LLM, o Grok é apenas um jogador. De facto, o número de parâmetros pode não ser suficiente para satisfazer os complexos requisitos comerciais e fornecer os resultados de alta qualidade que grandes empresas como a ChatGPT, a Claude e a Bard estabeleceram como padrão de ouro.

Em parte devido a este número reduzido de parâmetros, a Grok não consegue superar outros modelos tradicionais nos principais testes de referência, como o HumanEval e o MMLU:

Fonte: x.AI
O grok não é particularmente impressionante nesta área, embora, de acordo com a xAI, o grok contenha 8.192 tokens de contexto, o GPT-4 suporte 32.000 e o Claude outros 100.000 tokens de contexto; o novo GPT-4 Turbo OpenAI alcança uma janela de contexto de 128.000 tokens

Custo da inovação

O custo é um fator chave na avaliação do valor de qualquer produto, e a Grok não é exceção. O Chatbot está disponível por uma taxa mensal de US$ 16.

Considerando ofertas gratuitas como o Claude 2 e o ChatGPT, que são baseados no GPT-3.5 Turbo, o Grok pode ser difícil de vender. Especialmente tendo em conta que estes modelos gratuitos são altamente considerados pela sua precisão e já superam o Grok em alguns testes de referência.

Além disso, mesmo o LLM mais poderoso, o GPT-4, tem a vantagem de estar amplamente disponível, ser multimodal e poderoso, e promete superar o Grok.

Será que a introdução do Grok é sobretudo uma medida estratégica para aumentar o número de subscritores do Twitter Blue e expandir o fluxo de receitas do Twitter?

Estas preocupações evidenciam a dificuldade de a Grok se tornar um ator importante no espaço LLM. E as desvantagens vão para além do preço.

Ugly

A ficção foi deixada de lado

Utilizar personagens fictícias da ficção popular como modelos para o LLM é, sem dúvida, uma decisão criativa. Embora o apelo das personagens fictícias possa ser atrativo, acarreta riscos num mundo que depende cada vez mais de informações precisas. Os utilizadores que recorrem à inteligência artificial com perguntas e conselhos sérios podem ser enganados por sistemas que imitam personagens de desenhos animados.

À medida que a linha entre a ficção e a realidade se torna cada vez mais ténue, existe também o risco de os utilizadores interpretarem erradamente piadas ou respostas satíricas como informações reais. Na era digital, em que toda a informação é analisada e partilhada, as consequências de tais mal-entendidos podem ser de grande alcance. Isto é particularmente verdade quando estão envolvidas várias línguas.

O humor e a inteligência têm o seu lugar, mas é importante encontrar um equilíbrio, especialmente quando os utilizadores estão à procura de informações críticas. Dar prioridade ao humor em detrimento da exatidão pode ser divertido, mas também pode prejudicar a essência do que é suposto o LLM fornecer – informação fiável.

Overpromise and underdeliver

As grandes promessas de Elon Musk para a Grok eram muito prometedoras. Um olhar mais atento revela uma potencial contradição entre a propaganda e a realidade. O facto de os métodos tradicionais de formação LLM estarem limitados pelos dados de formação evidencia uma limitação fundamental.

Com 33 mil milhões de parâmetros e apenas alguns meses de desenvolvimento, o treino da Grok parece insignificante em comparação com outros gigantes do LLM. Embora a ideia de uma personalidade divertida e fictícia pareça apelativa, a expetativa de que os métodos de treino padrão possam produzir resultados revolucionários pode ser um pouco exagerada.

A comunidade de IA está habituada a hipérboles, mas tendo em conta os rápidos avanços neste campo, é importante que os utilizadores saibam ver para além da ilusão. Alcançar o estatuto de “super IA” é um desafio difícil e é pouco provável que o Grok o consiga alcançar com a sua configuração e formação actuais.

Para demonstrar as capacidades da Grok, Elon Musk comparou o seu chatbot a um pequeno LLM treinado em programação. Escusado será dizer que não foi uma luta justa.

Grok vs exemplo típico de GPT; Grok tem informações reais, o outro não.

Ameaça de desinformação

O MLM é poderoso, mas não infalível. Sem padrões rigorosos, distinguir factos de ficção pode ser extremamente difícil. A história recente fornece exemplos assustadores, como os chatbots treinados com dados do 4chan e Tay, um chatbot da Microsoft com poderes para interagir no Twitter. Estes bots não só espalharam discursos de ódio, como também se fizeram passar por pessoas reais e enganaram muitas audiências online.

Este flirt com a desinformação não é um incidente isolado. A imagem do Twitter deteriorou-se desde a nomeação de Elon, o que pode prejudicar a capacidade de Glock para fornecer informações consistentemente exactas. As pessoas com formação em ciências humanas são por vezes vítimas de ilusões e, quando estas distorções são tratadas como verdade, as consequências podem ser alarmantes.

O potencial de desinformação é uma bomba-relógio. Como os utilizadores confiam cada vez mais na inteligência artificial para obter informações, a desinformação pode levar a decisões erradas. Para ser um aliado de confiança, a Glock precisa de ter cuidado e certificar-se de que as suas brincadeiras não ofuscam a verdade.

Falta de capacidades multimodais?

No mundo em evolução da inteligência artificial, a abordagem baseada em texto da Grok parece uma relíquia do passado. Os utilizadores têm de pagar pelos serviços da Grok, mas é natural que se pergunte porquê, quando outros LLMs oferecem experiências mais ricas e multimodais.

O GPT-4-v, por exemplo, já deu grandes passos na multimodalidade, permitindo aos utilizadores ouvir, ver e falar. O futuro Gemini da Google promete capacidades semelhantes. Neste contexto, a proposta da Grok parece bastante insípida e levanta mais questões sobre a sua proposta de valor.

O mercado é altamente competitivo e os utilizadores são cada vez mais exigentes; se a Grok quer conquistar um nicho, tem de oferecer algo verdadeiramente único. Dado que os concorrentes oferecem funcionalidades avançadas e uma melhor precisão, muitas vezes de forma gratuita, a Grok tem uma tarefa difícil pela frente.
O lançamento do Grok foi um sucesso.
O lançamento do Grok gerou entusiasmo, mas também ceticismo: a abordagem do Produto Mínimo Viável (MVP) permite uma rápida iteração e melhoria com base no feedback dos utilizadores. No entanto, a concorrência de gigantes da inteligência artificial com recursos muito maiores é difícil.

Para ter sucesso, a Grok tem de oferecer funcionalidades novas e úteis. Num mercado concorrido, o valor de entretenimento por si só não é suficiente. Os utilizadores de IA não se deixam distrair por memes engraçados sobre cães.

Em última análise, o destino da Grok depende do equilíbrio entre a inovação e a facilidade de utilização. Embora se justifique um ceticismo saudável, seria prematuro abandonar a empresa por completo; a Grok pode continuar a abrir novos caminhos ou pode acabar como uma nota de rodapé no desenvolvimento da inteligência artificial. Seja como for, as suas origens pouco convencionais garantem que a Grok será um capítulo fascinante na história da inteligência artificial

Related Posts

Leave a Comment