MosaicML divulga o modelo MPT-7B-8K

xguru · 2023-07-21T10:02:02+09:00

LLM open source com 7B de parâmetros e suporte a comprimento de contexto de 8k Além do MPT-7B, foi treinado por 3 dias em 256 NVidia H100 usando mais 500B tokens de dados Três modelos foram disponibilizados: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat Pode ser usado para fins comerciais Suporte a entrada de 8k com ALiBi (Attention with Linear Biases Enables Input Length Extrapolation) Treinamento e inferência rápidos com FlashAttention e FasterTrasformer

(mosaicml.com)

9 pontos por xguru 2023-07-21 | Ainda não há comentários. | Compartilhar no WhatsApp

LLM open source com 7B de parâmetros e suporte a comprimento de contexto de 8k
Além do MPT-7B, foi treinado por 3 dias em 256 NVidia H100 usando mais 500B tokens de dados
Três modelos foram disponibilizados: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat
Pode ser usado para fins comerciais
Suporte a entrada de 8k com ALiBi (Attention with Linear Biases Enables Input Length Extrapolation)
Treinamento e inferência rápidos com FlashAttention e FasterTrasformer

MosaicML divulga o modelo MPT-7B-8K

Leituras relacionadas

Ainda não há comentários.