17 pontos por xguru 12 일 전 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Utiliza o modelo Gemma 4 do Google com base em WebGPU para execução totalmente on-device e o transforma em um assistente pessoal de IA residente no navegador
  • Sem chave de API, nuvem ou envio de dados externos - toda a inferência é processada localmente, e os dados não saem do dispositivo
  • Suporta comportamento de agente, como ler a página em visita, clicar em botões, preencher formulários, executar JavaScript e responder perguntas sobre o site
  • É possível escolher entre dois modelos, Gemma 4 E2B (~500MB) / E4B (~1.5GB), que são armazenados em cache após a primeira execução para reutilização
  • Suporte a quantização q4f16 e contexto de 128K (onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX)
  • Fornece 6 ferramentas integradas
    • read_page_content: lê o texto/HTML da página ou com base em um seletor CSS
    • take_screenshot: captura a página visível em PNG
    • click_element / type_text / scroll_page: manipulação do DOM com base em seletor CSS
    • run_javascript: executa JS com acesso completo ao DOM no contexto da página
  • Arquitetura em 3 camadas com Offscreen Document + Service Worker + Content Script
    • O offscreen document hospeda o modelo com @huggingface/transformers + WebGPU e executa o loop do agente
    • O service worker cuida do roteamento de mensagens e da captura de tela/execução de JS
    • O content script injeta o ícone gem e a sobreposição de chat em shadow DOM
  • Nas configurações, oferece troca de modelo, toggle de Thinking, limite máximo do loop de chamadas de ferramentas, limpeza do histórico de conversa e desativação por site
  • O diretório agent/ tem zero dependências e pode ser transformado em uma biblioteca independente com base nas interfaces ModelBackend e ToolExecutor
  • Requer Chrome com suporte a WebGPU / licença Apache-2.0 / implementação baseada em TypeScript

Ainda não há comentários.

Ainda não há comentários.