- Pesquisadores da Microsoft desenvolveram o BitNet b1.58 2B4T, um modelo de IA ultraeficiente
- Com quantização de 1 bit, ele atinge alta velocidade e baixo uso de memória, podendo rodar até em CPU, e foi lançado sob licença MIT
- Também pode rodar em CPUs como o Apple M2 e funciona sem GPU
- Com 2 bilhões de parâmetros, o BitNet b1.58 2B4T supera modelos da Meta, Google e Alibaba em desempenho
- No entanto, é necessário usar o framework
bitnet.cpp da Microsoft, e ainda há problemas de compatibilidade com GPUs
BitNet b1.58 2B4T, o modelo de IA ultraleve de 1 bit da Microsoft
O conceito do modelo ultraleve BitNet
- BitNet é um modelo de IA que aplica quantização de 1 bit, usando apenas três valores, -1, 0 e 1, para representar os parâmetros
- Modelos quantizados tradicionais normalmente usam 8 bits ou 4 bits, mas o BitNet usa apenas 1 bit e oferece eficiência de memória esmagadora
- Essa abordagem traz grandes vantagens em hardware de baixa especificação, especialmente em ambientes de CPU sem GPU
Características do BitNet b1.58 2B4T
- Número de parâmetros: 2 bilhões
- Dados de treinamento: 4 trilhões de tokens (equivalente a cerca de 33 milhões de livros)
- Disponibilizado como código aberto sob licença MIT
- Pode funcionar até mesmo em CPUs de uso geral, como o Apple M2
Comparação de desempenho e resultados de benchmark
- O BitNet b1.58 2B4T apresentou desempenho superior em alguns benchmarks em relação aos seguintes modelos:
- Meta Llama 3.2 1B
- Google Gemma 3 1B
- Alibaba Qwen 2.5 1.5B
- Principais benchmarks utilizados:
- GSM8K: avaliação de problemas de matemática de nível fundamental
- PIQA: avaliação da capacidade de raciocínio de senso comum físico
- Em alguns testes, foi até 2 vezes mais rápido, com uso de memória significativamente menor
Limitações e problemas de compatibilidade
- O desempenho do BitNet depende do framework proprietário da Microsoft,
bitnet.cpp
- Atualmente, o
bitnet.cpp suporta apenas CPUs específicas e não oferece suporte a GPU
- Por isso, a falta de compatibilidade com ambientes de GPU, padrão na infraestrutura de IA, é apontada como uma desvantagem
4 comentários
> BitNet é um modelo de IA com quantização de 1 bit, que representa os parâmetros usando apenas três valores: -1, 0 e 1
São 3 valores, mas 1 bit? Achei estranho e fui dar uma olhada em alguns comentários no HN,
> https://compilade.net/blog/ternary-packing
Como ele lida com 5 dígitos ternários para representar 3 valores, em vez de 8 bits que representam 2 valores por byte, estritamente falando não é um modelo de 1 bit, mas sim um modelo de
log(3) / log(2) = 1.5849...bits. Pelo visto é isso mesmo, já que o nome do modelo inclui b1.58.Parece que é preciso corrigir a 4ª linha de
2억 개의 파라미터를para20억 개의 파라미터를.Comentários do Hacker News
Na 4ª linha,
todos os modelos comparados têm 100–200 milhões de->todos os modelos comparados têm 1–2 bilhões deA tradução de billion em IA está estranha aqui.