21 pontos por xguru 2024-10-22 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Surgiu a necessidade de somar valores numéricos espalhados em 12 emails diferentes
  • Como copiar tudo manualmente dava preguiça, foi feita uma gravação de tela enquanto navegava pela conta do Gmail e depois usado o Google Gemini para extrair os números do vídeo — e funcionou muito bem

Raspagem de vídeo com bom custo-benefício usando AI Studio e QuickTime

  • Primeiro, foi feita uma gravação de tela com o QuickTime Player enquanto os emails relevantes eram abertos
  • O vídeo gravado, com 35 segundos de duração, foi enviado ao AI Studio do Google e foi solicitado ao modelo Gemini que extraísse os dados em formato de array JSON
    • Foi retornado com sucesso um array JSON contendo datas e valores em dólar
  • Depois, foi pedido que o resultado fosse convertido para o formato CSV para colar no Numbers
  • O custo foi extremamente baixo, cerca de menos de 0,1 centavo. No momento, o AI Studio está disponível gratuitamente

Limitações das alternativas

  • Copiar os dados manualmente é tedioso e tem alta chance de gerar erros
  • Usar a API do Gmail é complexo e exige muito esforço
  • A automação de navegador exige uma etapa separada de parsing dos emails
  • Usar ferramentas de IA sofisticadas com acesso à conta de email traz riscos como prompt injection

Vantagens da raspagem de vídeo

  • É possível extrair tudo o que aparece na tela
  • O usuário pode controlar completamente o que será exposto ao modelo de IA
  • Não é afetada por autenticação de sites nem por tecnologias anti-scraping
  • Não há nenhum custo de configuração
  • Pode ser usada a um custo muito baixo
  • Também pode ser útil na área de jornalismo de dados

Bônus: calculadora de preços de LLM

  • O autor também criou separadamente uma ferramenta para calcular preços por token
    • Ele usou o ChatGPT Code Interpreter, mas ocorreram erros de cálculo
  • Depois criou a calculadora de preços usando o Claude 3.5
    • É possível definir manualmente os preços de tokens de entrada/saída ou usar botões de preset para configurar os preços por modelo
  • Todo o processo de criação foi iterado e melhorado em 10 versões ao longo de 19 minutos por meio de conversas com o Claude
  • As informações de preço foram extraídas pelo Claude a partir de capturas de tela inseridas diretamente na conversa

Ainda não há comentários.

Ainda não há comentários.