Meta revela o Llama 2, modelo de linguagem de próxima geração

xguru · 2023-07-19T10:02:01+09:00

Modelo de linguagem de grande porte open source que pode ser usado tanto para pesquisa quanto para fins comerciais Treinado com 2 trilhões de tokens de dados, 40% a mais que o Llama 1 Comprimento de contexto 2x maior: 4096 Modelos em três tamanhos: 7B, 13B, 70B Desempenho superior ao de outros modelos de linguagem open source em muitos benchmarks, como inferência, código, proficiência e testes de conhecimento (MPT, Falcon, Llama-1) Foi treinado com fontes de dados públicas, e o Llama-2-chat ajustado também utiliza conjuntos públicos de instruções e mais de um milhão de anotações humanas Itens incluídos no download Model code Model Weights README (User Guide) Responsible Use Guide License Acceptable Use Policy Model Card

(ai.meta.com)

19 pontos por xguru 2023-07-19 | 3 comentários | Compartilhar no WhatsApp

Modelo de linguagem de grande porte open source que pode ser usado tanto para pesquisa quanto para fins comerciais
Treinado com 2 trilhões de tokens de dados, 40% a mais que o Llama 1
Comprimento de contexto 2x maior: 4096
Modelos em três tamanhos: 7B, 13B, 70B
Desempenho superior ao de outros modelos de linguagem open source em muitos benchmarks, como inferência, código, proficiência e testes de conhecimento (MPT, Falcon, Llama-1)
Foi treinado com fontes de dados públicas, e o Llama-2-chat ajustado também utiliza conjuntos públicos de instruções e mais de um milhão de anotações humanas
Itens incluídos no download
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card

3 comentários

kuroneko 2023-07-19

Desta vez também vai ter alguém soltando um magnet de torrent em nome do "interesse público"?

tpdns90321 2023-07-19

Desta vez, não foi necessário e foi divulgado imediatamente.

xguru 2023-07-19

Embora haja diferenças por área, as avaliações estão saindo como quase no nível do GPT-3.5 ou até melhores.

Parece totalmente aberto, mas há uma restrição importante. Se for um "serviço com mais de 700 milhões de MAU", é preciso solicitar uma licença à Meta, e a Meta pode recusar.

Parece algo como: "Google, TikTok, vocês não usem!"

A Microsoft agiu rápido e já disponibilizou o Llama 2 para uso no Azure. https://blogs.microsoft.com/blog/2023/…

Pelo visto, a Microsoft está conseguindo manter uma boa relação tanto com a OpenAI quanto com a Meta.

Meta revela o Llama 2, modelo de linguagem de próxima geração

Leituras relacionadas

3 comentários