19 pontos por xguru 2023-07-19 | 3 comentários | Compartilhar no WhatsApp
  • Modelo de linguagem de grande porte open source que pode ser usado tanto para pesquisa quanto para fins comerciais
  • Treinado com 2 trilhões de tokens de dados, 40% a mais que o Llama 1
  • Comprimento de contexto 2x maior: 4096
  • Modelos em três tamanhos: 7B, 13B, 70B
  • Desempenho superior ao de outros modelos de linguagem open source em muitos benchmarks, como inferência, código, proficiência e testes de conhecimento (MPT, Falcon, Llama-1)
  • Foi treinado com fontes de dados públicas, e o Llama-2-chat ajustado também utiliza conjuntos públicos de instruções e mais de um milhão de anotações humanas
  • Itens incluídos no download
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

3 comentários

 
kuroneko 2023-07-19

Desta vez também vai ter alguém soltando um magnet de torrent em nome do "interesse público"?

 
tpdns90321 2023-07-19

Desta vez, não foi necessário e foi divulgado imediatamente.

 
xguru 2023-07-19

Embora haja diferenças por área, as avaliações estão saindo como quase no nível do GPT-3.5 ou até melhores.

Parece totalmente aberto, mas há uma restrição importante. Se for um "serviço com mais de 700 milhões de MAU", é preciso solicitar uma licença à Meta, e a Meta pode recusar.

Parece algo como: "Google, TikTok, vocês não usem!"

A Microsoft agiu rápido e já disponibilizou o Llama 2 para uso no Azure. https://blogs.microsoft.com/blog/2023/…

Pelo visto, a Microsoft está conseguindo manter uma boa relação tanto com a OpenAI quanto com a Meta.