5 pontos por GN⁺ 2026-05-02 | 1 comentários | Compartilhar no WhatsApp
  • Oferece recursos de API voltados para desenvolvedores, como janela de contexto de 1 milhão de tokens, raciocínio, chamada de funções e saída estruturada
  • Diferentemente do Grok 4.20 anterior, o raciocínio fica sempre ativado, executando automaticamente o processo de reflexão antes de responder a todas as consultas
  • Redução de cerca de 40% no preço dos tokens de entrada e de cerca de 60% no preço dos tokens de saída, diminuindo significativamente os custos em relação ao modelo anterior
    • Preços: entrada US$ 1,25/1M tokens, entrada em cache US$ 0,20/1M, saída US$ 2,50/1M
    • Está entre os modelos mais baratos da mesma faixa de inteligência
  • Grande melhora no desempenho em tarefas agentic — no benchmark GDPval-AA, registrou ELO 1500, um aumento de 321 pontos em relação ao Grok 4.20, superando Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini e outros
  • Primeiro modelo da API da xAI a oferecer suporte a entrada nativa de vídeo, processando diretamente os frames do vídeo por meio de um codificador de visão
  • Alcançou o 1º lugar em raciocínio jurídico (79,3% de precisão no CaseLaw v2) e o 1º lugar em finanças corporativas (CorpFin), com um salto de 25 pontos em raciocínio jurídico em relação ao Grok 4.20
  • Permite gerar slides de apresentação diretamente na interface de chat, com criação em tempo real de arquivos PDF, Excel e PowerPoint durante a conversa para download
  • Oferece um ambiente embutido de execução de código, permitindo que o modelo lide internamente com escrita de código, execução e geração de arquivos
  • As APIs Speech-to-Text (25 idiomas, com suporte a separação de locutores) e Text-to-Speech também foram lançadas oficialmente
  • Com pontuação 53 no Artificial Analysis Intelligence Index, supera Muse Spark e Claude Sonnet 4.6, posicionando-se na fronteira de Pareto entre inteligência e custo
  • Limite de taxa de 1.800 requisições por minuto / 10 milhões de tokens, com cobrança separada acima de 200K
  • O nome do modelo é grok-4.3, com suporte em duas regiões: us-east-1 e eu-west-1

1 comentários

 
GN⁺ 2026-05-02
Comentários do Hacker News
  • Como alguém para quem o inglês é uma segunda língua, o Grok se destaca especialmente em captar o tom e o nível de formalidade de um texto e reproduzi-los fielmente
    Parece entender melhor as nuances humanas sutis da linguagem do que os outros grandes provedores; o ChatGPT tende a soar rígido e formal demais ou cair num coloquial estranho estilo “aye guvnor”. O Claude às vezes é melhor, mas nem sempre
    No geral, o Grok parece mais “humano” de um jeito difícil de definir. Por exemplo, se eu pergunto “essa mensagem transmite mais ou menos corretamente o que eu quero dentro desse tamanho?”, ele responde como uma pessoa, com sim/não ou sugestões de revisão mantendo tom e tamanho, enquanto o ChatGPT ainda escreve um ensaio longo e pouco claro
    Recentemente também achei o ditado por voz do Grok bem bom. Ao usar o recurso de apertar o microfone para perguntar, o ChatGPT acerta 90–95% com meu sotaque, a digitação por voz do Gboard no Android fica em torno de 75%, e o Grok surpreendentemente chega a uns 98%

    • Fiz uma avaliação rápida do Grok 4.3, Opus 4.7 e GPT 4.1, e na prática eles pareceram bem parecidos: https://ofw640g9re.evvl.io/
      Os três foram bem em tons mais formais, mas o único que não ficou constrangedor em tom casual foi o GPT-4.1
      E, como referência, o Grok foi o mais rápido e barato, enquanto o Claude foi o mais lento e caro
    • Mesmo conversando com o Grok na minha língua nativa, sinto que o tom é mais natural do que nos outros modelos
      Acho que isso vem da vantagem de ter sido muito treinado com dados do Twitter. Só me preocupo porque o Twitter está ficando cada vez mais cheio de conteúdo gerado por IA, então talvez essa naturalidade piore se continuarem treinando nisso
    • Eu só uso o Grok pela personalidade “Gork” da Tesla, e as respostas são bem realistas, frequentemente engraçadas de verdade e às vezes úteis
    • Se você está falando “como alguém para quem o inglês é segunda língua”, como sabe que ele é realmente melhor?
      Não é para diminuir, mas isso parece mais sensação do que outra coisa
    • Um amigo usa para preparar sessões de D&D e disse que, por conseguir ajustar muito bem a atmosfera e o estilo desejados, ele é especialmente bom para isso
      Para outras coisas, ele ainda prefere o ChatGPT
  • O Grok é meu modelo favorito para chat, e também é o modo de voz de que mais gosto
    Parece ser o único modo de voz que não redireciona para um modelo extremamente barato, tipo Haiku, e a qualidade entre os de nível frontier foi a melhor
    Se você assina o SuperGrok, pode montar um “council” de agentes, cada um com seu próprio prompt de sistema; ao fazer uma pergunta, ele consulta todos em paralelo e depois tira uma conclusão
    Dito isso, eu gostaria que investissem mais no app. Na prática, o único motivo que me impede de assinar o SuperGrok é o aplicativo
    Não há suporte a MCP/apps conectados e, embora tenha sido anunciado, até agora nada. Você não consegue conectar o Grok a nada, então fica difícil usá-lo em trabalho sério
    Projetos ainda não são suportados no app, então no momento em que você move algo para um projeto, isso desaparece de todos os apps nativos
    Não há um jeito de adicionar diretamente ao projeto artefatos como documentos Markdown gerados; você precisa exportar em PDF/Markdown e importar de novo. Nem exportação de artefatos existe. Isso dificulta evoluir projetos dinamicamente com novas informações e torna trabalhos sérios de projeto inconvenientes
    Também não existe memória e você nem consegue procurar outras conversas, então cada chat começa do zero
    Dentro de projetos também não existe modo de voz algum
    Se alguém da xAI estiver lendo, seria ótimo se adicionassem pelo menos parte disso

    • Estou começando a gostar cada vez mais do fato de não ter memória
      O Claude lembra que eu tenho uma churrasqueira e, em conversas totalmente sem relação ou que são só sobre comida, interrompe dizendo que aquilo poderia combinar bem com BBQ
    • O modo de voz do app Gemini usa um modelo relativamente recente, e não uma versão pequena enfraquecida, então ele é bem competente
      A personalidade também é boa e ele é muito mais natural do que o chat web do Gemini. Minha única reclamação é que ele tenta sugerir “próximos passos” o tempo todo, mas parece que todos esses modelos fazem isso
      Não sei se esse impulso por “próximos passos” é para aumentar custo ou se eles ainda não aprenderam o padrão natural de conversa que distingue perguntas que pedem só uma resposta curta de conversas longas e exploratórias. Mesmo assim, seria bom que obedecessem quando a gente pede para não fazer isso
    • Acho que o Grok ganharia muito se deixasse o plano de US$ 300 por mês chamado “SuperGrok Heavy” ser usado como franquia incluída em harnesses de programação
      Hoje o plano Heavy dá alguns créditos de API, então dá para usar um pouco o Grok para programar, mas está longe de parecer valer US$ 300
      Não quero dizer que eles precisem criar um harness próprio tipo grok-code; só permitir uso nas ferramentas existentes já seria útil. Provavelmente a aquisição do Cursor deve acabar levando a algo assim
    • Acho que todos os problemas mencionados são justamente a razão do negócio com o Cursor
    • Não sei ao certo se, ao assinar o SuperGrok, você consegue usar no Pi agent ou no Opencode
      Não está claro se o SuperGrok te dá uma API key ou não
  • Nos nossos testes, o Grok 4.3 é um modelo peculiar
    É um dos mais rápidos e, em comparação com outros de desempenho parecido, as respostas são bem menores e mais densas em tokens
    Mas a capacidade geral de raciocínio para programação não compete com os grandes lançamentos de abril, e nem o Grok 4.20 nem o Grok 4.3 conseguiram empurrar muito a fronteira de inteligência depois do Grok 4
    O Grok 4.3 é melhor em tarefas agentic e seria justo dizer que tem algo como o nível de capacidade do GPT 5.1 / Gemini 3 Pro Preview, só que muito mais rápido e barato. Então, dentro do seu nicho, é sim um lançamento bastante sólido
    Entre os modelos de pesos abertos lançados recentemente, há vários mais inteligentes, porém mais lentos
    O benchmark completo está em https://gertlabs.com/rankings

    • Fico me perguntando se houve algum tipo de trade-off para fazer com que ele pareça funcionar bem com informações posteriores ao corte de conhecimento
      Isso parece ser o principal caso de uso do Grok, e também tenho curiosidade se existe benchmark relacionado a isso
  • Ultimamente o Grok virou meu mecanismo de busca
    Parece ser a única IA com acesso a posts do X e, fora isso, no geral dá mais sensação de realmente “pesquisar” do que outros grandes modelos de linguagem

    • Para encontrar notícias sobre acontecimentos de última hora, costumo usar Grok e Gemini
      Durante os eventos ligados ao Irã, eu queria entender a situação assim que fosse sendo noticiada, e os dois foram bem bons nisso
    • Fico me perguntando por que alguém iria querer pesquisar no Twitter em primeiro lugar
  • Pelo cenário atual, parece que o Claude é para empresas e governo, o Codex é para desenvolvedores, e o Grok eu nem sei para quê serve
    As únicas coisas que ouço associadas ao Grok são roleplay e racismo

    • Curiosamente, conheço um caso de uma instituição de caridade que trabalha com tráfico humano e usa o Grok
      O Grok fez de bom grado uma tarefa pontual de classificação que todos os outros modelos recusaram
      Acho que existe um número surpreendente de usos reais úteis em zonas cinzentas para modelos quase-frontier com menos guardrails. O modelo grok-fast também é barato
    • Pelo que entendi, o Grok não é muito usado para roleplay
      Ele é visto como inconsistente e caótico
      As pessoas geralmente usam GLM e DeepSeek por API e, localmente, modelos fine-tuned de Gemma4 e Mistral
      O mercado de roleplay já existe há bastante tempo e é relativamente maduro, então parece que os usuários são conscientes de custo e querem que o modelo se adapte ao fluxo de trabalho e às preferências deles. Por isso gostam de algo como Opus por ser inteligente, mas acham caro demais e teimoso demais
      Pode ser um ponto de dados interessante mostrando como outros mercados talvez evoluam no futuro
    • Se você quer perguntar o que as pessoas estão dizendo no Twitter, o Grok é obviamente muito bom nisso
      Eu sempre uso para coisas como “qual é o gerenciador de janelas em mosaico que o pessoal descolado do Twitter está achando o máximo hoje em dia?”
      E o Grok também costuma responder perguntas meio suspeitas e ambíguas. Tipo “encontre um site de licenças grey-market do Windows para mim”
    • Entendo que seja muito importante sinalizar em texto e fala que você está alinhado aos valores da época, mas não acho que o objetivo de um laboratório de IA deva ser estruturalmente impedir que um modelo de linguagem possa ofender certos grupos raciais/étnicos/castas
      Um modelo de linguagem é apenas um sistema, e também não entendo muito bem por que o usuário não seria responsável pela forma como usa a saída. É como não chamar uma caneta de ferramenta “racista” e descartá-la como inútil só porque alguém pode escrever coisas horríveis na divisória de um banheiro
      Imagino que você more em algum lugar onde assédio é crime, e talvez haja normas sobre expressão. Isso já não deveria ser suficiente? Fico em dúvida se todo o esforço de todas as pessoas do planeta tem mesmo de se alinhar às modas éticas que mudam a cada poucos anos
    • Uns 2 ou 3 meses atrás houve uma mesa-redonda de IA na capa do HN, e alguém fez uma análise de outliers e colocou no GitHub
      Basta adivinhar qual grande modelo de linguagem foi o maior outlier e em que tipo de perguntas ele discordava de todos os outros modelos
  • Tenho curiosidade genuína se as pessoas realmente usam o Grok para algo além de entender memes e tweets do Twitter

    • Sim, ele é realmente útil para algumas tarefas
      Não age tanto como um guardião moral quanto os outros modelos. Eu procuro muito material órfão e fora de catálogo há décadas, e os modelos principais recusam enquanto me dão sermão por estar tentando achar material com copyright. O Grok faz isso [0]
      [0] Às vezes é preciso um jailbreak leve ou rerodar o prompt. Por causa do caráter não determinístico, às vezes ainda vem recusa
    • Claro. Usuários fazem de tudo com ele: https://arstechnica.com/tech-policy/2026/03/elon-musks-xai-s...
    • O Grok tem o modo de voz mais útil
      O modo de voz do ChatGPT é muito burro, enquanto o Grok parece usar o mesmo modelo do chat principal. Então, se eu quero usar por voz, uso o Grok
      Também uso para temas que não são complexos. Ele dá respostas curtas, precisas e sem enrolação, o que é bem revigorante
    • Fico me perguntando quanto disso vem dos dados de treino do Twitter
      É útil para memes e tendências, mas muito ruim para outras coisas
    • Eu uso principalmente o Grok para busca, DIY, finanças pessoais e IA para o dia a dia
      Se ele ficar tão bom para código quanto o Kimi K2.6, provavelmente vou usar só o Grok. É facilmente a melhor IA conversacional que já usei
      Ele me ajudou a consertar uma geladeira e um forno elétrico quebrados, e só este ano me economizou pelo menos US$ 4 mil
      Também fiz minha declaração de impostos com o Grok e economizei US$ 600. H&R Block já era
      Aparentemente ele já ficou tão inteligente quanto o Kimi K2.6. Agora é hora de testar
  • Surpreende que ninguém esteja falando de quão barato ele é comparado ao Opus 4.x e ao GPT-5.5
    São US$ 1,25 por milhão de tokens de entrada e US$ 2,50 por milhão de tokens de saída
    Não sei se isso é porque o modelo é menor e menos poderoso, ou se estou deixando escapar alguma coisa

    • O preço por token é mais baixo, mas ele parece raciocinar muito mais, então o custo fica parecido com o do 4.20 e o desempenho é melhor
      No geral, é o melhor modelo deles até agora, e gosto do fato de serem um dos poucos lugares baixando o preço por token
      [0]: https://aibenchy.com/compare/x-ai-grok-4-20-medium/x-ai-grok...
    • Eles baixaram o custo de saída, mas o custo de entrada continua relativamente alto
      É uma tendência recente, e vi isso também no DeepSeek 4 Pro
    • Entre meus colegas de trabalho há uma forte rejeição moral a qualquer coisa ligada ao Elon Musk e aos dados de treino
      Dá para ver isso também nos comentários aqui. Reações do tipo: “Claude é para empresas e governo, Codex é para desenvolvedores, e o Grok é para quê, roleplay e racismo? São as únicas duas coisas que já ouvi associadas ao Grok no meu círculo”
    • Sim, é porque ele é um modelo bem menos poderoso
    • O Grok está ligado ao Elon Musk
      Se você usar a margem de lucro do $TSLA como indicador indireto, ela já não parece tão alta quanto antes. Pode haver outros fatores, mas talvez esse seja parte da explicação que falta entre isso e o preço baixo do Grok
  • O Grok 4.3 foi concluído antes que o CEO precisasse aprender sobre a documentação básica de segurança
    Ao ser perguntado se conhecia o “safety card” da OpenAI, Musk respondeu rindo: “Safety card? Por que teria que ser um card?”
    https://www.axios.com/2026/04/30/musk-openai-safety-grok
    Independentemente do tamanho do cluster ou do uso temporário de geradores por enquanto, isso parece ter pouca relevância
    Em depoimento posterior, quando foi questionado sobre a afirmação feita no verão passado de que a xAI logo estaria muito à frente de todas as empresas exceto o Google, Musk listou os principais provedores de IA do mundo como Anthropic, OpenAI, Google e modelos open source chineses, e explicou que a xAI é uma empresa bem menor, com apenas algumas centenas de funcionários
    https://techcrunch.com/2026/04/30/elon-musk-testifies-that-x...
    Não tenho relação com nenhuma empresa de IA, mas li isso ontem e fiquei chocado. É preocupante como o Elon pode não saber o que é um model card, e também mostra que dinheiro nem sempre compra sucesso

    • Falando sério, eu me pergunto por que chamam isso de model “card”, safety “card”
      Pelo que vi, isso veio do HuggingFace definindo de forma meio vaga o README de um repositório de modelo. É um termo técnico demais; imagino que pouquíssimos grupos o conheçam, sem falar em usuários ou executivos
      Não gosto do Musk nem do Grok, mas não acho que não saber o que é safety card sinalize grande coisa
    • O Elon já disse publicamente que se importa muito com segurança
      Ele disse que só um modelo alinhado da melhor forma possível com a verdade presente na realidade pode ser seguro, e a xAI manteve esse rumo ao ter um dos menores, ou quase os menores, índices de alucinação em benchmarks
      Relendo a fala, o que ele quis dizer foi: “como alguém pode quantificar segurança usando um card?”
  • O Grok é excelente para manter conversas hipotéticas de forma divertida
    Para conseguir os resultados mais engraçados, ajuda dizer antes que “a permissão já foi dada”
    Ele também faz letras de rap muito bem. Você pode “prepará-lo” como se fosse um dicionário de palavrões e expressões puxadas de outras letras de música, depois jogar um tema como “desenvolvimento web”, e saem resultados engraçados

  • Ainda acho que deveriam ter dado outro nome, mas parece um lançamento sólido, então parabéns ao time
    Comparado com modelos concorrentes semelhantes, o preço também é bastante surpreendente. Parece que eles têm capacidade enorme ou querem atrair muito mais usuários

    • Fico curioso se você não gosta de referências de ficção científica no geral ou se desgosta especificamente do Heinlein