A xAI, a empresa de inteligência artificial fundada por Elon Musk, anunciou uma atualização significativa para seu chatbot Grok, disponível na plataforma X (Twitter). Agora, os usuários pagantes têm a capacidade de enviar imagens para o Grok, que pode não apenas entender o conteúdo visual, mas também interpretar piadas, uma funcionalidade que Musk destacou em uma recente postagem na rede social.
Os assinantes do X que acessam o Grok podem fazer upload de diversas imagens e fazer perguntas sobre elas. Essa nova funcionalidade, segundo Musk, está em fase inicial, mas ele promete que a tecnologia irá “melhorar rapidamente”.
A habilidade de entender imagens representa um avanço importante para o chatbot, que já possuía diversas outras capacidades.
Além da análise de imagens, Musk também revelou que o Grok está em processo de aprimoramento para entender documentos em formatos variados. Quando um usuário expressou preocupação sobre a incapacidade do Grok de interpretar arquivos PDF, Musk garantiu que essa limitação será superada em breve. “Não por muito tempo”, afirmou, acrescentando que a equipe está finalizando atualizações que, segundo ele, “levaram anos para ser concluídas por outras empresas”.
Em agosto, a xAI lançou uma versão atualizada do Grok, chamada Grok-2, que trouxe melhorias significativas em relação ao seu predecessor. Essa versão é capaz de gerar imagens a partir de textos, utilizando o modelo FLUX.1 da Black Forest Labs. Contudo, assim como muitas inovações de Musk, a disponibilidade do Grok-2 é restrita a desenvolvedores e assinantes do X.
Embora a xAI esteja trabalhando arduamente para expandir as funcionalidades do Grok, a precisão das informações fornecidas pelo chatbot ainda gera questionamentos. De acordo com o site Engadget, o Grok tem apresentado informações errôneas sobre eventos importantes, como as eleições presidenciais dos Estados Unidos. Assim, os usuários são aconselhados a usar o Grok com uma pitada de ceticismo.
Concorrência no mercado de IA
Enquanto o Grok se destaca na análise de imagens e humor, outras empresas de tecnologia também estão avançando em suas inovações. A Meta, por exemplo, lançou o NotebookLlama, uma IA que gera podcasts a partir de textos. Esta ferramenta oferece uma alternativa ao NotebookLM do Google, que funciona de maneira semelhante.
O NotebookLlama começa criando uma transcrição a partir de arquivos, como PDFs ou artigos online. Depois, a IA adiciona dramatizações e interrupções para transformar o texto em um formato mais envolvente para o formato de áudio.