Web LLM - Executando LLMs acelerados no navegador com WebGPU

xguru · 2023-04-18T10:17:01+09:00

Executa LLMs como LLaMA e Vicuna no navegador sem servidor usando WASM Acelera com WebGPU, mas também oferece suporte separadamente aos backends de GPU suportados pelo Apache TVM (CUDA, OpenCL, Vulkan) Usa a tecnologia MLC (Machine Learning Compilation)

(github.com/mlc-ai)

14 pontos por xguru 2023-04-18 | Ainda não há comentários. | Compartilhar no WhatsApp

Executa LLMs como LLaMA e Vicuna no navegador sem servidor usando WASM
Acelera com WebGPU, mas também oferece suporte separadamente aos backends de GPU suportados pelo Apache TVM (CUDA, OpenCL, Vulkan)
Usa a tecnologia MLC (Machine Learning Compilation)

Web LLM - Executando LLMs acelerados no navegador com WebGPU

Leituras relacionadas

Ainda não há comentários.