Web LLM - suporte inicial ao Llama2 7B/13B
(webllm.mlc.ai)- Serviço que executa LLMs como Llama, RedPajama e Vicuna em WASM no navegador, sem servidor
- Suporte inicial ao Llama 2 7B/13B
- Também oferece suporte ao Llama 2 70B, mas só pode ser usado em Macs com Apple Silicon + 64 GB de RAM ou mais
- Aceleração com WebGPU
7 comentários
Porque é uma 750Ti....
Coisas que saem no output de URL frequentemente quebram até no ChatGPT mesmo. Acho que é isso.
Achei muito impressionante ver o Stable Diffusion rodando na web,
será que o WebGPU realmente consegue unificar de vez as APIs de GPU?
Incrível mesmo.
Web LLM - suporte ao Llama2 7B/13B começa