13 pontos por xguru 2023-04-03 | 1 comentários | Compartilhar no WhatsApp
  • Com a mudança no formato de arquivo, agora é possível usar mmap() sem read(), tornando o carregamento dos pesos de 10 a 100 vezes mais rápido
  • Também passou a oferecer suporte a 7B em arquivo único e 13B em múltiplos arquivos, e o código de carregamento ficou muito mais simples
  • Além disso, com essa mudança, os tensores passam a ficar alinhados em limites de 32 bytes, o que pode trazer ganhos adicionais de desempenho em certos processadores