Gemma Gem - extensão do Chrome que executa o modelo Google Gemma 4 totalmente on-device no navegador

xguru · 2026-04-18T09:31:02+09:00

Utiliza o modelo Gemma 4 do Google com base em WebGPU para execução totalmente on-device e o transforma em um assistente pessoal de IA residente no navegador Sem chave de API, nuvem ou envio de dados externos - toda a inferência é processada localmente, e os dados não saem do dispositivo Suporta comportamento de agente, como ler a página em visita, clicar em botões, preencher formulários, executar JavaScript e responder perguntas sobre o site É possível escolher entre dois modelos, Gemma 4 E2B (~500MB) / E4B (~1.5GB), que são armazenados em cache após a primeira execução para reutilização Suporte a quantização q4f16 e contexto de 128K (onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX) Fornece 6 ferramentas integradas read_page_content: lê o texto/HTML da página ou com base em um seletor CSS take_screenshot: captura a página visível em PNG click_element / type_text / scroll_page: manipulação do DOM com base em seletor CSS run_javascript: executa JS com acesso completo ao DOM no contexto da página Arquitetura em 3 camadas com Offscreen Document + Service Worker + Content Script O offscreen document hospeda o modelo com @huggingface/transformers + WebGPU e executa o loop do agente O service worker cuida do roteamento de mensagens e da captura de tela/execução de JS O content script injeta o ícone gem e a sobreposição de chat em shadow DOM Nas configurações, oferece troca de modelo, toggle de Thinking, limite máximo do loop de chamadas de ferramentas, limpeza do histórico de conversa e desativação por site O diretório agent/ tem zero dependências e pode ser transformado em uma biblioteca independente com base nas interfaces ModelBackend e ToolExecutor Requer Chrome com suporte a WebGPU / licença Apache-2.0 / implementação baseada em TypeScript

(github.com/kessler)

18 pontos por xguru 2026-04-18 | Ainda não há comentários. | Compartilhar no WhatsApp

Utiliza o modelo Gemma 4 do Google com base em WebGPU para execução totalmente on-device e o transforma em um assistente pessoal de IA residente no navegador
Sem chave de API, nuvem ou envio de dados externos - toda a inferência é processada localmente, e os dados não saem do dispositivo
Suporta comportamento de agente, como ler a página em visita, clicar em botões, preencher formulários, executar JavaScript e responder perguntas sobre o site
É possível escolher entre dois modelos, Gemma 4 E2B (~500MB) / E4B (~1.5GB), que são armazenados em cache após a primeira execução para reutilização
Suporte a quantização q4f16 e contexto de 128K (onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX)
Fornece 6 ferramentas integradas
- read_page_content: lê o texto/HTML da página ou com base em um seletor CSS
- take_screenshot: captura a página visível em PNG
- click_element / type_text / scroll_page: manipulação do DOM com base em seletor CSS
- run_javascript: executa JS com acesso completo ao DOM no contexto da página
Arquitetura em 3 camadas com Offscreen Document + Service Worker + Content Script
- O offscreen document hospeda o modelo com @huggingface/transformers + WebGPU e executa o loop do agente
- O service worker cuida do roteamento de mensagens e da captura de tela/execução de JS
- O content script injeta o ícone gem e a sobreposição de chat em shadow DOM
Nas configurações, oferece troca de modelo, toggle de Thinking, limite máximo do loop de chamadas de ferramentas, limpeza do histórico de conversa e desativação por site
O diretório agent/ tem zero dependências e pode ser transformado em uma biblioteca independente com base nas interfaces ModelBackend e ToolExecutor
Requer Chrome com suporte a WebGPU / licença Apache-2.0 / implementação baseada em TypeScript

Gemma Gem - extensão do Chrome que executa o modelo Google Gemma 4 totalmente on-device no navegador

Leituras relacionadas

Ainda não há comentários.