3 pontos por mscheong01 2024-04-22 | Ainda não há comentários. | Compartilhar no WhatsApp

Este é um código simples de inferência de speculative decoding implementado em C.
Assim como o llama2.c que serviu de base, tentei escrevê-lo como um código simples com fins educacionais.
Em seguida, pretendo implementar alguns artigos um pouco mais recentes.

Ainda não há comentários.

Ainda não há comentários.