O
Ideogram, um gerador de imagens de IA criado por ex-engenheiros do Google, lançou seu primeiro conjunto de atualizações com o objetivo de tornar a plataforma mais funcional e utilizável. As atualizações adicionam recursos para melhor corresponder às ofertas da Stable Diffusion e Midjourney a um preço atraente.
A primeira versão pública do Ideogram, em fevereiro, rapidamente ganhou popularidade entre os entusiastas da IA como uma alternativa forte e capaz à Midjourney, Dall-E 3 e Stable Diffusion. Os testes efectuados pela TCN revelaram que se destacava na compreensão imediata, nas capacidades de geração de texto, na consciência espacial, na adesão imediata, na variedade de estilos, na geração de pessoas e marcas e na qualidade geral em comparação com outros geradores de imagens populares.
Estamos entusiasmados por lançar uma grande atualização para o Ideogram 1.0, o nosso modelo texto-imagem mais avançado, juntamente com várias novas funcionalidades, incluindo a “descrição” para legendas de imagens, a solicitação negativa e o controlo da qualidade e da velocidade de processamento de imagens”, lê-se no anúncio oficial.
O “Describe” analisa uma imagem e ajuda na legendagem; o “negative prompt” diz ao modelo quais os elementos que deve evitar gerar, e os controlos de velocidade e de reprodução de imagens equilibram a qualidade da produção com a eficiência para aqueles que preferem gerações rápidas em vez de gerações detalhadas. Esta última caraterística imita os modelos Turbo e LCM da Stable Difussion.
No entanto, estas actualizações têm um senão: só estão disponíveis para clientes pagantes. Os utilizadores gratuitos terão acesso ao modelo, mas estão limitados a gerar até 25 lotes de 4 imagens cada.
Quem quiser experimentar estas funcionalidades pode atualizar para o plano “Basic” por 7 dólares por mês ou para a opção “Plus” por 16 dólares. Os planos pagos também dão aos utilizadores acesso a outras vantagens, como gerações privadas, controlo de sementes, capacidades de pintura e gerações ilimitadas em modo lento.
A funcionalidade “descrever” é uma adição significativa, especialmente para utilizadores básicos. Este assistente fornece descrições pormenorizadas de qualquer imagem carregada, que podem ser utilizadas para gerar mensagens mais precisas ou mais descritivas para corresponder melhor à referência em iterações subsequentes. Os utilizadores podem solicitar descrições para qualquer imagem no feed do Ideogram ou para as suas próprias imagens carregadas a partir de um dispositivo local.
Agora, o Ideogram também permite que os utilizadores alternem entre três opções de renderização: rápida, predefinida e de qualidade. O modo rápido dá prioridade à velocidade e gera imagens em aproximadamente cinco segundos, enquanto o modo de qualidade dá prioridade a detalhes mais finos e gera imagens em aproximadamente 20 segundos.
A funcionalidade de prompt negativo, entretanto, alarga as capacidades de edição do Ideogram. Esta ferramenta permite aos utilizadores especificar o que não querem ver nas imagens geradas, proporcionando um maior controlo sobre o resultado. É uma funcionalidade particularmente útil para refinar os resultados da geração de texto para imagem, permitindo imagens mais precisas e relevantes logo à primeira tentativa.
Por último, a Ideogram afirma ter melhorado a reprodução de texto e o fotorrealismo. A equipa afirma que a atualização reduz as taxas de erro de texto em mais 15% em comparação com o modelo original. A Ideogram afirma que os revisores preferiram as imagens geradas pelo modelo atualizado 30-50% mais do que a versão inicial original.
A equipa do Ideogram anunciou pela primeira vez as melhorias no mês passado durante uma sessão no Discord, que gerou um burburinho positivo entre a comunidade de utilizadores.
Com essas melhorias e os níveis pagos mensais de US $ 7 a US $ 16, o Ideogram é um candidato forte e econômico para uma ferramenta de IA geradora de imagens. Para comparação, uma assinatura MidJourney custa entre US$ 96 e US$ 1152 por ano, uma assinatura ChatGPT Plus – que dá acesso ao Dall-E 3- custa US$ 20 por mês, e outros geradores de imagens de IA como Leonardo AI e Maze Guru têm níveis de assinatura entre US$ 10 e US$ 25.
Para aqueles que não estão dispostos a pagar por funcionalidades premium, entretanto, o Stable Diffusion de código aberto é gratuito e oferece funcionalidades semelhantes, pelo menos para utilizadores com computadores mais potentes.