A nova ferramenta File Search lançada na API Gemini do Google simplifica de forma revolucionária a construção de sistemas RAG (Retrieval-Augmented Generation):
- Em vez do processo complexo tradicional de chunking, embeddings e configuração de banco de dados vetorial, tudo é processado automaticamente com um único upload de arquivo (2 linhas de código), e na consulta os documentos relevantes são buscados e injetados no modelo.
- Armazenamento e embeddings de consulta são gratuitos; há apenas o custo de indexação inicial de US$ 0,15 por 1 milhão de tokens.
- Arquivos compatíveis: PDF, DOCX, TXT etc.
- Em um exemplo prático, a busca em 3.000 arquivos é concluída em 2 segundos, reduzindo drasticamente o tempo de desenvolvimento de protótipos.
- Além disso, oferece recursos como citações automáticas e filtragem por metadados.
- Limitações: limite de 10 stores por projeto, com 1 GB no plano gratuito.
- Avaliação: reduz a barreira de entrada para desenvolvimento com RAG e permite focar na aplicação.
3 comentários
Como era de se esperar do Google
Obrigado por compartilhar. Qualidade! Estou realmente curioso.
Quando vi que estavam oferecendo o notebooklm como serviço, pensei que em algum momento talvez lançassem algo no formato de uma API tipo o NotebookLM, e agora saiu como um serviço de API chamado File Search, caramba.
Para tentar fazer um RAG direito, eu montava pipeline/workflow, ligava o Ollama e também ficava trocando de modelo pra lá e pra cá, então com certeza tinha uma certa barreira de entrada. (Só usando pra saber mesmo.) Mas, se a qualidade for garantida até certo ponto, acho que vai dar para usar com muita comodidade.