LLaMA-rs - LLaMA implementado em Rust
(github.com/setzer22)- Projeto que faz o port de
llama.cpppara Rust - Suporte a modelos nas versões f16 ou quantizadas em 4 bits
- Assim como o original, usa a biblioteca de tensores
ggmltal como está para oferecer o mesmo desempenho do original
1 comentários
Também existe uma implementação do LLaMA em Rust: RLLaMA - Rust+OpenCL+AVX2.
llama.cpp - inferência do modelo LLaMA do Facebook em C/C++ puro