55 pontos por davespark 2025-11-10 | 3 comentários | Compartilhar no WhatsApp

A nova ferramenta File Search lançada na API Gemini do Google simplifica de forma revolucionária a construção de sistemas RAG (Retrieval-Augmented Generation):

  • Em vez do processo complexo tradicional de chunking, embeddings e configuração de banco de dados vetorial, tudo é processado automaticamente com um único upload de arquivo (2 linhas de código), e na consulta os documentos relevantes são buscados e injetados no modelo.
  • Armazenamento e embeddings de consulta são gratuitos; há apenas o custo de indexação inicial de US$ 0,15 por 1 milhão de tokens.
  • Arquivos compatíveis: PDF, DOCX, TXT etc.
  • Em um exemplo prático, a busca em 3.000 arquivos é concluída em 2 segundos, reduzindo drasticamente o tempo de desenvolvimento de protótipos.
  • Além disso, oferece recursos como citações automáticas e filtragem por metadados.
  • Limitações: limite de 10 stores por projeto, com 1 GB no plano gratuito.
  • Avaliação: reduz a barreira de entrada para desenvolvimento com RAG e permite focar na aplicação.

3 comentários

 
kaydash 2025-11-11

Como era de se esperar do Google

 
dkmin 2025-11-10

Obrigado por compartilhar. Qualidade! Estou realmente curioso.

 
unknowncyder 2025-11-10

Quando vi que estavam oferecendo o notebooklm como serviço, pensei que em algum momento talvez lançassem algo no formato de uma API tipo o NotebookLM, e agora saiu como um serviço de API chamado File Search, caramba.

Para tentar fazer um RAG direito, eu montava pipeline/workflow, ligava o Ollama e também ficava trocando de modelo pra lá e pra cá, então com certeza tinha uma certa barreira de entrada. (Só usando pra saber mesmo.) Mas, se a qualidade for garantida até certo ponto, acho que vai dar para usar com muita comodidade.