LLaMA-CPU - um fork para executar o LLaMA na CPU

xguru · 2023-03-09T11:20:01+09:00

Executa o modelo LLaMA da Meta na CPU A configuração é quase a mesma Ao testar com o modelo 7B, para carregar, é necessário usar swap/zram mesmo com 32 GiB de RAM Na inferência real, usa apenas cerca de menos de 20 GiB de RAM Em um Ryzen 7900X, o modelo 7B consegue inferir algumas palavras por segundo

(github.com/markasoftware)

4 pontos por xguru 2023-03-09 | Ainda não há comentários. | Compartilhar no WhatsApp

Executa o modelo LLaMA da Meta na CPU
A configuração é quase a mesma
Ao testar com o modelo 7B, para carregar, é necessário usar swap/zram mesmo com 32 GiB de RAM
Na inferência real, usa apenas cerca de menos de 20 GiB de RAM
Em um Ryzen 7900X, o modelo 7B consegue inferir algumas palavras por segundo

LLaMA-CPU - um fork para executar o LLaMA na CPU

Leituras relacionadas

Ainda não há comentários.