1 pontos por rkttu 2025-12-30 | Ainda não há comentários. | Compartilhar no WhatsApp

Estamos lançando a primeira versão do framework aipack, que realiza chunking semântico usando BGE-M3, MarkItDown e um parser de estrutura Markdown, e armazena os resultados em arquivos Parquet. Ele foi projetado para implementar RAG com base em um formato de arquivo neutro, independente de modelo e banco de dados, que pode ser reutilizado a qualquer momento, além de permitir a execução de um servidor MCP.

O foco do aipack está em implementar um RAG que não dependa de NPU nem de GPU, ao mesmo tempo em que cria um ambiente fácil de expandir para diversas estruturas de RAG no futuro. Partindo da premissa de que "se for possível criar arquivos Parquet de alta qualidade, é possível fazer qualquer coisa", este é um projeto experimental que tenta desacoplar (decoupling) o pipeline de RAG comumente usado na indústria.

Como esta é uma implementação de uma ideia que eu vinha pensando há algum tempo, ainda há muitas partes incipientes, mas ficarei muito grato por feedbacks e opiniões para, com base nisso, evoluir o projeto para algo melhor!

Ainda não há comentários.

Ainda não há comentários.