- Utiliza o modelo Gemma 4 do Google com base em WebGPU para execução totalmente on-device e o transforma em um assistente pessoal de IA residente no navegador
- Sem chave de API, nuvem ou envio de dados externos - toda a inferência é processada localmente, e os dados não saem do dispositivo
- Suporta comportamento de agente, como ler a página em visita, clicar em botões, preencher formulários, executar JavaScript e responder perguntas sobre o site
- É possível escolher entre dois modelos, Gemma 4 E2B (~500MB) / E4B (~1.5GB), que são armazenados em cache após a primeira execução para reutilização
- Suporte a quantização q4f16 e contexto de 128K (
onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX)
- Fornece 6 ferramentas integradas
read_page_content: lê o texto/HTML da página ou com base em um seletor CSS
take_screenshot: captura a página visível em PNG
click_element / type_text / scroll_page: manipulação do DOM com base em seletor CSS
run_javascript: executa JS com acesso completo ao DOM no contexto da página
- Arquitetura em 3 camadas com Offscreen Document + Service Worker + Content Script
- O offscreen document hospeda o modelo com
@huggingface/transformers + WebGPU e executa o loop do agente
- O service worker cuida do roteamento de mensagens e da captura de tela/execução de JS
- O content script injeta o ícone gem e a sobreposição de chat em shadow DOM
- Nas configurações, oferece troca de modelo, toggle de Thinking, limite máximo do loop de chamadas de ferramentas, limpeza do histórico de conversa e desativação por site
- O diretório
agent/ tem zero dependências e pode ser transformado em uma biblioteca independente com base nas interfaces ModelBackend e ToolExecutor
- Requer Chrome com suporte a WebGPU / licença Apache-2.0 / implementação baseada em TypeScript
Ainda não há comentários.