10 pontos por xguru 2025-02-19 | 1 comentários | Compartilhar no WhatsApp
  • A missão da xAI é entender a natureza do universo e, para isso, desenvolve o Grok, uma IA que coloca a busca pela verdade como prioridade máxima
  • O Grok 3 apresenta um desempenho mais de 10 vezes superior ao do Grok 2, graças ao esforço de uma equipe excepcional e a recursos massivos de computação
    • Grok é uma palavra usada por um personagem criado em Marte no romance Stranger in a Strange Land, de Heinlein, e significa "compreender algo de forma completa e profunda"
    • Empatia (Empathy) também atua como um elemento importante
  • A xAI iniciou seu primeiro modelo há 17 meses, e o Grok 1 era um modelo com 314B (314 bilhões) de parâmetros
    • Depois vieram o Grok 1.5 e o Grok 2, culminando no desenvolvimento do Grok 3, com um salto expressivo de desempenho
  • Data center: a xAI construiu seu próprio data center para acelerar o desenvolvimento do Grok
    • Foram necessários 122 dias para colocar em operação o primeiro cluster com 100 mil GPUs e, depois, apenas 92 dias para dobrar a capacidade para 200K
    • Trata-se do maior cluster H100 totalmente conectado do mundo, e toda essa capacidade de GPU e poder computacional vem sendo usada para melhorar o Grok
  • Grok 3: desempenho mais de 10 vezes superior ao do Grok 2 (na prática, mais de 15 vezes)
    • O pré-treinamento foi concluído no início de janeiro, e o modelo continua em treinamento
  • Benchmarks: o Grok 3 mostra ótimo desempenho em raciocínio matemático geral, ciência e programação
    • A versão menor, Grok 3 Mini, também fica no mesmo nível dos concorrentes
    • Em especial, registrou desempenho de topo em questões da AIME (competição de matemática do ensino médio)
    • Na avaliação mais recente de chatbots (Chatbot Arena), registrou pontuação ELO acima de 1.400 e ficou em 1º lugar entre todos os modelos

Novos recursos do Grok 3

  • Raciocínio avançado (Advanced Reasoning)
    • O Grok 3 não apenas fornece respostas simples, mas também conta com a capacidade de chegar às respostas por meio de um processo de pensamento aprofundado
    • Reforçou a habilidade de analisar problemas, encontrar erros e explorar diferentes possibilidades
    • Casos reais:
      • Cálculo de trajetória para viagem a Marte: simula uma trajetória de ida e volta entre a Terra e Marte e a exibe visualmente
      • Desenvolvimento de um novo jogo: gera na hora um novo jogo que combina Tetris e Zuma
  • Capacidade de aprendizado em tempo real do Grok 3
    • Novas melhorias são feitas todos os dias, e a diferença de desempenho pode aparecer até de um dia para o outro
    • O modelo continua evoluindo mesmo durante os testes
  • Melhorias de engenharia usando o Grok 3
    • Internamente, o Grok 3 também reduz em centenas de horas o trabalho de programação e resolução de problemas
    • Ao resolver problemas de matemática e programação competitiva, aprende a detectar e corrigir seus próprios erros

Próxima geração de recursos: agentes baseados no Grok 3

  • Deep Search
    • Um novo mecanismo de busca com IA, capaz de encontrar informações mais profundas do que um buscador comum
    • Analisa informações de vários sites e compara dados recentes para oferecer a resposta mais confiável
    • Exemplos:
      • Consultar a próxima data de lançamento da Starship
      • Analisar builds populares de Path of Exile
      • Prever o campeão do torneio de basquete March Madness
  • Assistente de voz com IA (Voice Assistant)
    • Está prevista a adição de um recurso para que os usuários possam se comunicar com o Grok como em uma conversa real
    • O Grok não faz apenas conversão simples para texto, mas também consegue conversar de forma natural considerando tom de voz, emoção e entonação

Lançamento do Grok 3 e planos futuros

  • Cronograma de lançamento
    • A partir de hoje, a versão beta do Grok 3 será disponibilizada para assinantes Premium+
    • Ao atualizar o app do X (antigo Twitter), será possível usar os novos recursos
    • Lançamento do site independente grok.com e do app dedicado do Grok (iOS/Android)
  • Nova opção de assinatura: Super Grok
    • Lançamento do modelo de assinatura Super Grok para usuários que querem experimentar os recursos mais recentes rapidamente
  • Planos futuros
    • Lançamento da API do Grok 3 previsto (nas próximas semanas)
    • Código aberto do Grok 3 previsto (nos próximos meses)
    • Construção de um cluster de próxima geração ainda mais poderoso (5 vezes mais desempenho que o atual)
    • Planeja acelerar o desenvolvimento de jogos com IA por meio da criação de um estúdio de games com IA

Conclusão

  • O Grok 3 está abrindo uma nova dimensão para os modelos de IA, e a xAI continua trabalhando para levá-lo ainda mais longe
  • Com forte capacidade de raciocínio, mecanismo de busca com IA e recurso de assistente de voz, o Grok evolui cada vez mais como um verdadeiro assistente de IA
  • Elon Musk prevê que no futuro a IA alcançará conquistas acadêmicas como a Medalha Fields (o Nobel da matemática)

1 comentários

 
GN⁺ 2025-02-19
Comentários do Hacker News
  • Karpathy descreveu sua impressão inicial do Grok como estando no nível do o1-pro da OpenAI
  • O Grok atingiu nível de ponta em um dos benchmarks
  • A concorrência no campo dos LLMs está ficando acirrada, o que é uma boa notícia para os consumidores
    • Espera-se que uma empresa monopolista não absorva todo o valor
  • Há evidências de que é possível construir um LLM de ponta com menos custo
  • O conteúdo gravado não foi inspirador
    • Não havia nada de novo, era algo que já se sabia
  • Muitas pessoas acham que estão imitando a OpenAI
    • Consideram que a OpenAI ainda continua mostrando do que é capaz
  • É preciso reconhecer que a xAI alcançou os outros rapidamente
    • Está à frente não só em modelo, mas também em produto
  • O melhor resultado de um Grok competitivo pode ser quebrar a percepção popular de que o ChatGPT domina
  • Karpathy acredita que isso está no nível do o1-pro
  • A OpenAI prova mais uma vez que não há barreiras técnicas
    • Consideram razoável a proposta de Elon para adquirir a OpenAI
  • Elon é popular na China, então pode garantir engenheiros de IA com facilidade
    • Pode oferecer ações da xAI/XSpace/Neurallink
  • Boa sorte aos investidores que avaliam a OpenAI em mais de US$ 100 bilhões
  • Há planos para divulgar os pesos do Grok 2
  • Imagina-se um futuro em que LLMs insiram anúncios personalizados