- Desenvolvimento de um bot de crawling com ChatGPT para coletar informações de produtos da Coupang
- As colunas a serem coletadas são nome do produto, preço original, preço de venda, avaliação por estrelas, número de reviews, informações de desconto no cartão, informações de pontos/recompensas e informações de entrega
- Métodos para reduzir o tamanho do HTML a fim de evitar o limite de tokens e pontos a considerar ao escrever prompts
- Pular produtos patrocinados
- Tratamento de exceções quando a estrutura do DOM for diferente
- Verificação das colunas obrigatórias (nome do produto, preço)
- O ChatGPT é uma ferramenta extremamente útil, mas exige um pouco de depuração e ajustes (no fim, especialistas acabam se beneficiando ainda mais)
- Para coletar grandes volumes de dados, é preciso considerar formas de evitar bloqueios
5 comentários
Parece que o próprio texto aqui foi todo escrito pelo GPT.
Acho que é isso que resume tudo..
Estou criando um crawler com o ChatGPT e tenho recebido muita ajuda com parsing e extração de XPath.
É um texto sobre criar crawling com GPT, mas no fim acaba sendo propaganda do HashScraper mesmo.
Blog de tecnologia é tudo assim mesmo, né... hehe