- Os modelos Grok-2 e Grok-2 mini foram lançados para usuários do Grok na plataforma X
- O Grok-2 traz grandes avanços em conversação, programação e raciocínio em relação ao modelo anterior, o Grok-1.5
- Uma versão inicial do Grok-2, testada no leaderboard do LMSYS com o nome
sus-column-r, mostrou desempenho superior ao Claude 3.5 Sonnet e ao GPT-4-Turbo
Modelo de linguagem e recursos de chat do Grok-2
- Uma versão inicial do Grok-2 foi enviada ao LMSYS Chatbot Arena (famosa ferramenta de benchmark competitivo para LLMs) com o nome sus-column-r
- Em pontuação Elo geral do modelo, superou Claude e GPT-4
Benchmarks
- O modelo Grok-2 foi avaliado em uma série de benchmarks acadêmicos, incluindo raciocínio, compreensão de leitura, matemática, ciência e programação
- Grok-2 e Grok-2 mini mostraram melhorias significativas em relação ao modelo anterior Grok-1.5
- Alcançaram desempenho competitivo com outros modelos de ponta em áreas como conhecimento científico em nível de pós-graduação (GPQA), conhecimento geral (MMLU, MMLU-Pro) e problemas de olimpíada de matemática (MATH)
- O Grok-2 apresentou desempenho de ponta em raciocínio matemático visual (MathVista) e perguntas e respostas baseadas em documentos (DocVQA)
Experimente o Grok com informações em tempo real no X
- O Grok vem sendo continuamente aprimorado na plataforma X
- Usuários do X Premium e Premium+ podem acessar dois novos modelos: Grok-2 e Grok-2 mini
- O Grok-2 pode ser acessado pela aba Grok no app do X e é um assistente de IA de ponta com recursos avançados tanto em texto quanto em compreensão visual
- O Grok-2 mini é um modelo menor, porém capaz, que oferece equilíbrio entre velocidade e qualidade das respostas
- Em parceria com a Black Forest Labs, a empresa está experimentando o modelo FLUX.1 e expandindo os recursos do Grok no X
Criando com o Grok usando a Enterprise API
- No fim deste mês, Grok-2 e Grok-2 mini serão lançados para desenvolvedores por meio de uma nova plataforma de API corporativa
- A nova API foi construída sobre uma nova pilha tecnológica personalizada que permite implantações de inferência multirregionais com baixa latência em escala global
- Ela oferece recursos de segurança aprimorados, como autenticação multifator obrigatória, estatísticas ricas de tráfego e análise avançada de cobrança
- Também fornece APIs administrativas para integrar gerenciamento de equipes, usuários e cobrança às ferramentas e serviços internos existentes
What is Next?
- Grok-2 e Grok-2 mini estão sendo lançados no X
- Há grande expectativa em torno de diversos recursos baseados em IA, como busca aprimorada oferecida pelo Grok, insights aprofundados sobre publicações no X e recursos de resposta melhorados
- Em breve, será apresentada uma prévia da compreensão multimodal como parte central da experiência Grok no X e na API
- Desde o anúncio do Grok-1, em novembro de 2023, a X.AI vem avançando em ritmo extraordinário sob a liderança de uma equipe pequena, mas extremamente talentosa
- Com a introdução do Grok-2, a empresa passa a estar na linha de frente do desenvolvimento de IA
- O foco está em avançar as capacidades centrais de raciocínio com um novo cluster de computação
- Muito mais novidades serão compartilhadas nos próximos meses
- "Estamos procurando pessoas para se juntar a uma equipe pequena e focada, comprometida em construir as inovações mais impactantes para o futuro da humanidade"
Ainda não há comentários.