StableLM é lançado — o modelo de linguagem aberto da Stability AI

xguru · 2023-04-20T11:22:02+09:00

Modelos 3B/7B foram lançados, com os modelos 15B/30B/65B também previstos para lançamento, e há planos de chegar a 175B Os modelos usam a licença CC BY-SA-4.0, permitindo uso comercial com atribuição de autoria Baseado no dataset aberto The Pile, mas treinado com um novo dataset 3 vezes maior, com 1,5T tokens O comprimento de contexto é de 4096 tokens Também foi lançado como PoC o modelo StableLM-Tuned-Alpha-7B, ajustado seguindo o procedimento do Alpaca Usa 5 datasets conversacionais: Stanford's Alpaca, Nomic-AI's gpt4all, RyokoAI's ShareGPT52K datasets, Databricks labs' Dolly, Anthropic's HH A demonstração do chatbot foi publicada no Hugging Face

(github.com/Stability-AI)

24 pontos por xguru 2023-04-20 | 2 comentários | Compartilhar no WhatsApp

Modelos 3B/7B foram lançados, com os modelos 15B/30B/65B também previstos para lançamento, e há planos de chegar a 175B
Os modelos usam a licença CC BY-SA-4.0, permitindo uso comercial com atribuição de autoria
Baseado no dataset aberto The Pile, mas treinado com um novo dataset 3 vezes maior, com 1,5T tokens
O comprimento de contexto é de 4096 tokens
Também foi lançado como PoC o modelo StableLM-Tuned-Alpha-7B, ajustado seguindo o procedimento do Alpaca
- Usa 5 datasets conversacionais: Stanford's Alpaca, Nomic-AI's gpt4all, RyokoAI's ShareGPT52K datasets, Databricks labs' Dolly, Anthropic's HH
- A demonstração do chatbot foi publicada no Hugging Face

2 comentários

laeyoung 2023-04-20

Muito bom!

xguru 2023-04-20

Assim como a divulgação do Stable Diffusion acelerou o mercado, agora também veremos uma enxurrada de dados e casos de uso disponíveis publicamente para modelos de linguagem.

StableLM é lançado — o modelo de linguagem aberto da Stability AI

Leituras relacionadas

2 comentários