Stagehand - framework open source de automação de navegador com IA

(github.com/browserbase)

16 pontos por GN⁺ 2025-01-10 | 1 comentários | Compartilhar no WhatsApp

Stagehand é um framework simples e escalável de navegação web com IA, totalmente compatível com o Playwright
- Oferece três APIs simples de IA — act, extract e observe — permitindo automação web por meio de linguagem natural
- Aumenta a acessibilidade até para usuários não técnicos e o torna menos vulnerável a pequenas mudanças na UI/DOM
- Exemplos: extrair as principais notícias do Hacker News, pesquisar e comprar AirPods na Amazon, buscar as estatísticas dos últimos 10 jogos de Steph Curry na ESPN
Permite escrever com facilidade código de automação de navegador durável e com bom desempenho.
Quando usado com o Browserbase, oferece excelentes ferramentas de depuração, como replay de sessão e depuração passo a passo.
O Stagehand está em estado de lançamento inicial e está coletando ativamente o feedback da comunidade.
Licença MIT

1 comentários

GN⁺ 2025-01-10

Comentários no Hacker News

Houve a opinião de que, ao extrair dados de uma página com o Stagehand, seria bom retornar elementos xpath que permitam fazer o scraping da página novamente sem usar um LLM
- Ao fazer scraping de uma nova página, seria possível usar ferramentas de LLM não determinísticas e, ao fazer scraping novamente para atualizar o conteúdo, usar métodos tradicionais de scraping
- Há dúvidas sobre quão estável é a transição da versão com LLM para a versão em xcode, e se seria possível voltar para a versão com LLM caso o script em xcode falhe
- Houve a opinião de que seria útil usar ferramentas inteligentes para fazer scraping e, com o tempo, construir uma biblioteca simples de scripts de scraping
Não concordam com a ideia de que o Stagehand deva substituir o Playwright e similares
- Pessoalmente, gostariam de usá-lo como um fluxo de trabalho intermediário para gerar código determinístico em Playwright, mas a ferramenta parece ser voltada para execução direta
- Houve a opinião de que será difícil convencer alguém a usar um LLM em tempo de execução em uma suíte de testes em desenvolvimento
Tentaram implementar automação de workflow usando um framework parecido, mas pararam por causa de CAPTCHAs invisíveis
- A instância do Playwright pode ser detectada pela forma como interage com o DOM
- Consideram que crawling e scraping estão ficando fora de controle, então isso pode acabar virando um padrão
Houve a opinião de que o nome "create-browser-app" é genérico demais e que deveria ter sido chamado de "stagehand"
Antes de criar uma plataforma de testes para testdriver.ai, fizeram um SDK parecido chamado Goodlooks, mas ele não recebeu muita atenção
- Compartilham o link para quem tiver interesse
Depois de usar o Stagehand, concluíram que é uma abstração útil
- É útil para construir scrapers para sites hostis, já que proxies e CAPTCHAs vêm embutidos
- Perguntam se há planos de fazer uma abstração semelhante para MCP e uso do computador
Gostaram do foco do Stagehand em tornar a automação do navegador mais resistente a mudanças no DOM
- Os métodos act, extract e observe são muito limpos
- Recomendam o Lightpanda, um navegador headless leve e open source
Perguntam se existe a possibilidade de automatizar abas de navegador já abertas
Estão acompanhando no Slack a velocidade impressionante com que essa equipe desenvolve produtos e esperam com interesse os próximos avanços
Perguntam se isso funciona convertendo métodos de IA em submétodos do Playwright e se é possível depurar os métodos reais convertidos
- Há dúvidas sobre se comandos diferentes podem sair a cada execução de teste ou se existe um comportamento determinístico

Stagehand - framework open source de automação de navegador com IA

Leituras relacionadas

1 comentários

Comentários no Hacker News