- Modelo de linguagem de grande porte open source que pode ser usado tanto para pesquisa quanto para fins comerciais
- Treinado com 2 trilhões de tokens de dados, 40% mais do que o Llama 1
- Comprimento de contexto 2 vezes maior: 4096
- Três tamanhos de modelo: 7B, 13B, 70B
- Desempenho superior a outros modelos de linguagem open source em muitos benchmarks, como raciocínio, codificação, proficiência e testes de conhecimento (MPT, Falcon, Llama-1)
- Foi treinado com fontes de dados públicas, e o Llama-2-chat ajustado também utiliza conjuntos públicos de instruções e mais de um milhão de anotações humanas
- Uso de Reinforcement Learning from Human Feedback (RLHF), incluindo Rejection Sampling e Proximal Policy Optimization (PPO)
- Itens incluídos no download
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 comentários
Comentários do Hacker News