Scrapeghost - biblioteca de web scraping com GPT
(jamesturk.github.io)- Uma biblioteca experimental que extrai dados de HTML sem precisar escrever nenhum código específico da página
- Basta definir o formato dos dados que deseja extrair e passar a URL, e ela faz a extração automaticamente
- Internamente, faz limpeza e segmentação do HTML para reduzir custos e também verifica alucinações para confirmar se os dados extraídos são realmente valores exatos presentes na página
- Oferece um recurso de definição de orçamento para os custos de chamadas da API do GPT
Ainda não há comentários.