- Modelo de linguagem de grande porte open source que pode ser usado tanto para pesquisa quanto para fins comerciais
- Treinado com 2 trilhões de tokens de dados, 40% a mais que o Llama 1
- Comprimento de contexto 2x maior: 4096
- Modelos em três tamanhos: 7B, 13B, 70B
- Desempenho superior ao de outros modelos de linguagem open source em muitos benchmarks, como inferência, código, proficiência e testes de conhecimento (MPT, Falcon, Llama-1)
- Foi treinado com fontes de dados públicas, e o Llama-2-chat ajustado também utiliza conjuntos públicos de instruções e mais de um milhão de anotações humanas
- Itens incluídos no download
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
3 comentários
Desta vez também vai ter alguém soltando um magnet de torrent em nome do "interesse público"?
Desta vez, não foi necessário e foi divulgado imediatamente.
Embora haja diferenças por área, as avaliações estão saindo como quase no nível do GPT-3.5 ou até melhores.
Parece totalmente aberto, mas há uma restrição importante. Se for um "serviço com mais de 700 milhões de MAU", é preciso solicitar uma licença à Meta, e a Meta pode recusar.
Parece algo como: "Google, TikTok, vocês não usem!"
A Microsoft agiu rápido e já disponibilizou o Llama 2 para uso no Azure. https://blogs.microsoft.com/blog/2023/…
Pelo visto, a Microsoft está conseguindo manter uma boa relação tanto com a OpenAI quanto com a Meta.