30 pontos por xguru 3 일 전 | 5 comentários | Compartilhar no WhatsApp
  • Motor de navegador headless especializado em web scraping e automação de agentes de IA
  • Incorpora o motor V8 para executar JavaScript real e, com a implementação do Chrome DevTools Protocol (CDP), permite reutilizar diretamente código de Puppeteer e Playwright
  • Muito mais leve que o Chrome headless, com memória de 30 MB (vs 200 MB+), binário de 70 MB (vs 300 MB+) e carregamento de página em 85 ms (vs ~500 ms)
  • Como o carregamento de página fica no nível de 85 ms, em crawls em massa o tempo de espera é 5 a 10 vezes menor em comparação com o Chrome
  • Distribuição em binário único, com zero dependências externas como Chrome, Node.js etc.
  • Modo stealth integrado com --stealth:
    • Aplicação automática de configurações para contornar antibot, como ocultar navigator.webdriver e disfarçar funções nativas
    • Randomização de fingerprint por sessão (GPU, canvas, áudio etc.)
  • Bloqueio automático de trackers de anúncios, analytics e telemetria em 3.520 domínios, melhorando também a velocidade de renderização da página
  • No CLI, use obscura fetch para renderizar uma única página e obscura serve para iniciar um servidor WebSocket CDP
  • Com obscura scrape url1 url2 ... --concurrency 25, é possível fazer scraping paralelo com facilidade
  • Com --eval "document.title", é possível executar expressões JS diretamente no CLI e extrair apenas o resultado, o que é útil para extração simples de dados
  • Suporte, via API CDP, aos principais domínios como Target, Page, Runtime, DOM, Network, Fetch e Input, incluindo também a conversão de DOM para Markdown (LP.getMarkdown)
  • Ao enviar formulários e fazer login, o processamento de POST, redirecionamentos 302 e manutenção de cookies é tratado automaticamente, sem necessidade de implementar manualmente o fluxo de autenticação
  • Licença Apache 2.0

5 comentários

 
xguru 3 일 전

Este é um navegador headless que tem estado muito em alta ultimamente.
Além de ser leve, ele também é popular porque dizem que o modo stealth funciona muito bem.

 
okxrr 3 일 전

A conta no GitHub foi criada há um mês

Pelo menos quando fiz uma pesquisa simples no Google, não apareceu muita reação nem avaliações
No Hacker News, Reddit etc. também quase não encontrei nada..
Talvez eu que não esteja conseguindo achar..
Mas já tem mais de 6 mil estrelas

Onde dá para verificar o que está bombando no momento?
Parece um software bem perigoso..

 
xguru 3 일 전

Acho que vi bastante sobre isso no Twitter. Dizem que é fácil de automatizar.
Na prática, eu ainda não consegui testar o modo furtivo, então não consigo avaliar muito bem.

 
okxrr 2 일 전

Não parece ser algo comum. (Hoje em dia há tantos projetos assim que talvez seja melhor considerar isso como algo comum...)

É um programa que provavelmente será usado com informações sensíveis,
então acho que seria melhor usar com calma, depois de algum tempo.

 
pmc7777 1 일 전

Parece ser uma ferramenta criada por u/Total_Nectarine_3623.

https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp

Pelos outros posts, parece que a pessoa tem interesse em ONIST e CTF, então também parece ter interesse em segurança da informação, e fez o primeiro release com um único commit enorme. Vendo isso, dá a impressão de que houve muito "vibe coding" no repositório original e depois tudo foi dividido em vários commits, então talvez tenham juntado tudo em um só porque ficaria meio complicado publicar exatamente como estava; além disso, pelo handle do GitHub ser h4ckfOr0day, há uma espécie de tradição? de publicar com conta descartável quando se trata de ONIST ou de ferramentas que não são exatamente abordadas por meios totalmente convencionais.

A confiança em open source ainda precisa ser construída, mas não parece haver nenhuma intenção específica por trás disso.