- Oferece a maneira mais fácil de mover e transformar dados entre bancos de dados PostgreSQL
- Streaming em tempo real: transmite alterações de dados quase em tempo real usando replicação lógica do PostgreSQL
- Cópia em massa: realiza rapidamente a sincronização inicial de dados com cópia em massa paralelizável
- Transformações poderosas: aplica transformações com base em expressões regulares, mascara dados sensíveis e filtra de acordo com os valores das colunas
- Roteamento flexível: roteia dados entre tabelas de forma fluida, inclusive para tabelas com nomes diferentes ou para a mesma tabela por meio de mapeamento personalizado de colunas
- Exemplos de regras de transformação
- Mascaramento de endereços de e-mail: converte a coluna de e-mail em caracteres de mascaramento.
- Formatação de números de telefone: altera o formato de números de telefone usando expressões regulares.
- Roteamento de tabelas e mapeamento de colunas
- Roteamento flexível de tabelas: roteia a tabela de usuários para a tabela de clientes, mapeando ID e nome de usuário para ID do cliente e nome do cliente.
- Roteamento para múltiplas tabelas: roteia a tabela de pedidos para a tabela de transações, mapeando ID e valor total para ID da transação e valor.
- Casos de uso comuns
- Replicação de dados em tempo real entre bancos de dados PostgreSQL
- Construção de pipelines ETL com transformação de dados
- Redirecionamento, mascaramento e filtragem de dados
- Execução de migrações de banco de dados sem downtime
- Streaming de eventos a partir do PostgreSQL
- Como funciona
- O pg_flo aproveita o sistema de replicação lógica do PostgreSQL para capturar e transmitir alterações de dados.
- Usa o NATS como message broker, separando a leitura do WAL dos processos de replicação e dos workers para oferecer flexibilidade e escalabilidade.
- As transformações e a filtragem são aplicadas antes de os dados chegarem ao destino.
1 comentários
Comentários do Hacker News
O projeto pg_flo parece muito interessante, especialmente o arquivamento para S3 e a versão mais barata da ferramenta
Estou trabalhando em um projeto que usa replicação lógica do PostgreSQL para limpar dados do banco de dados principal e arquivá-los no S3
Estou pesquisando soluções de CDC para Postgres e queria saber se o pg_flo poderia ajudar
Espero que possa ser uma alternativa ao Debezium
O pglogical pode rodar dentro do Postgres, mas o pg_flo parece ser um serviço externo, não uma extensão
Estou muito animado para experimentar esta ferramenta
Queria saber como ele se diferencia do Sequin
Eu estava procurando uma ferramenta parecida, então o timing é perfeito
Gostaria de saber se usar replicação é melhor do que fazer backup no S3
Ferramenta muito legal