- Surgiu a necessidade de somar valores numéricos espalhados em 12 emails diferentes
- Como copiar tudo manualmente dava preguiça, foi feita uma gravação de tela enquanto navegava pela conta do Gmail e depois usado o Google Gemini para extrair os números do vídeo — e funcionou muito bem
Raspagem de vídeo com bom custo-benefício usando AI Studio e QuickTime
- Primeiro, foi feita uma gravação de tela com o QuickTime Player enquanto os emails relevantes eram abertos
- O vídeo gravado, com 35 segundos de duração, foi enviado ao AI Studio do Google e foi solicitado ao modelo Gemini que extraísse os dados em formato de array JSON
- Foi retornado com sucesso um array JSON contendo datas e valores em dólar
- Depois, foi pedido que o resultado fosse convertido para o formato CSV para colar no Numbers
- O custo foi extremamente baixo, cerca de menos de 0,1 centavo. No momento, o AI Studio está disponível gratuitamente
Limitações das alternativas
- Copiar os dados manualmente é tedioso e tem alta chance de gerar erros
- Usar a API do Gmail é complexo e exige muito esforço
- A automação de navegador exige uma etapa separada de parsing dos emails
- Usar ferramentas de IA sofisticadas com acesso à conta de email traz riscos como prompt injection
Vantagens da raspagem de vídeo
- É possível extrair tudo o que aparece na tela
- O usuário pode controlar completamente o que será exposto ao modelo de IA
- Não é afetada por autenticação de sites nem por tecnologias anti-scraping
- Não há nenhum custo de configuração
- Pode ser usada a um custo muito baixo
- Também pode ser útil na área de jornalismo de dados
Bônus: calculadora de preços de LLM
- O autor também criou separadamente uma ferramenta para calcular preços por token
- Ele usou o ChatGPT Code Interpreter, mas ocorreram erros de cálculo
- Depois criou a calculadora de preços usando o Claude 3.5
- É possível definir manualmente os preços de tokens de entrada/saída ou usar botões de preset para configurar os preços por modelo
- Todo o processo de criação foi iterado e melhorado em 10 versões ao longo de 19 minutos por meio de conversas com o Claude
- As informações de preço foram extraídas pelo Claude a partir de capturas de tela inseridas diretamente na conversa
Ainda não há comentários.