16 pontos por GN⁺ 2025-01-10 | 1 comentários | Compartilhar no WhatsApp
  • Stagehand é um framework simples e escalável de navegação web com IA, totalmente compatível com o Playwright
    • Oferece três APIs simples de IA — act, extract e observe — permitindo automação web por meio de linguagem natural
    • Aumenta a acessibilidade até para usuários não técnicos e o torna menos vulnerável a pequenas mudanças na UI/DOM
    • Exemplos: extrair as principais notícias do Hacker News, pesquisar e comprar AirPods na Amazon, buscar as estatísticas dos últimos 10 jogos de Steph Curry na ESPN
  • Permite escrever com facilidade código de automação de navegador durável e com bom desempenho.
  • Quando usado com o Browserbase, oferece excelentes ferramentas de depuração, como replay de sessão e depuração passo a passo.
  • O Stagehand está em estado de lançamento inicial e está coletando ativamente o feedback da comunidade.
  • Licença MIT

1 comentários

 
GN⁺ 2025-01-10
Comentários no Hacker News
  • Houve a opinião de que, ao extrair dados de uma página com o Stagehand, seria bom retornar elementos xpath que permitam fazer o scraping da página novamente sem usar um LLM

    • Ao fazer scraping de uma nova página, seria possível usar ferramentas de LLM não determinísticas e, ao fazer scraping novamente para atualizar o conteúdo, usar métodos tradicionais de scraping
    • Há dúvidas sobre quão estável é a transição da versão com LLM para a versão em xcode, e se seria possível voltar para a versão com LLM caso o script em xcode falhe
    • Houve a opinião de que seria útil usar ferramentas inteligentes para fazer scraping e, com o tempo, construir uma biblioteca simples de scripts de scraping
  • Não concordam com a ideia de que o Stagehand deva substituir o Playwright e similares

    • Pessoalmente, gostariam de usá-lo como um fluxo de trabalho intermediário para gerar código determinístico em Playwright, mas a ferramenta parece ser voltada para execução direta
    • Houve a opinião de que será difícil convencer alguém a usar um LLM em tempo de execução em uma suíte de testes em desenvolvimento
  • Tentaram implementar automação de workflow usando um framework parecido, mas pararam por causa de CAPTCHAs invisíveis

    • A instância do Playwright pode ser detectada pela forma como interage com o DOM
    • Consideram que crawling e scraping estão ficando fora de controle, então isso pode acabar virando um padrão
  • Houve a opinião de que o nome "create-browser-app" é genérico demais e que deveria ter sido chamado de "stagehand"

  • Antes de criar uma plataforma de testes para testdriver.ai, fizeram um SDK parecido chamado Goodlooks, mas ele não recebeu muita atenção

    • Compartilham o link para quem tiver interesse
  • Depois de usar o Stagehand, concluíram que é uma abstração útil

    • É útil para construir scrapers para sites hostis, já que proxies e CAPTCHAs vêm embutidos
    • Perguntam se há planos de fazer uma abstração semelhante para MCP e uso do computador
  • Gostaram do foco do Stagehand em tornar a automação do navegador mais resistente a mudanças no DOM

    • Os métodos act, extract e observe são muito limpos
    • Recomendam o Lightpanda, um navegador headless leve e open source
  • Perguntam se existe a possibilidade de automatizar abas de navegador já abertas

  • Estão acompanhando no Slack a velocidade impressionante com que essa equipe desenvolve produtos e esperam com interesse os próximos avanços

  • Perguntam se isso funciona convertendo métodos de IA em submétodos do Playwright e se é possível depurar os métodos reais convertidos

    • Há dúvidas sobre se comandos diferentes podem sair a cada execução de teste ou se existe um comportamento determinístico