1 pontos por GN⁺ 2025-02-22 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Sky-T1

  • Treinando o modelo O1 Preview por US$ 450

    • Modelos como O1 e Gemini 2.0 demonstram excelente capacidade de raciocínio para resolver tarefas complexas, fazendo isso por meio de longos processos internos de pensamento.
    • No entanto, a falta de acesso aos detalhes técnicos e aos pesos do modelo cria uma barreira para a participação da academia e da comunidade open source.
    • Em resposta a isso, surgiram alguns esforços notáveis para treinar modelos de raciocínio com pesos abertos na área de matemática, como Still-2 e Journey.
    • A equipe NovaSky, da UC Berkeley, está explorando várias técnicas para avançar as capacidades de raciocínio de modelos base e ajustados por instrução.
    • Este estudo alcança desempenho competitivo de raciocínio não apenas em matemática, mas também em programação, no mesmo modelo.
  • Contribuidores

    • Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica

Ainda não há comentários.

Ainda não há comentários.