Lições aprendidas ao operar o Airflow em larga escala
(shopify.engineering)A Shopify usa isso para extração de dados, treinamento de modelos de machine learning, manutenção de tabelas Apache Iceberg, modelagem de dados baseada em DBT etc.
- O acesso a arquivos pode ser lento ao usar armazenamento em nuvem
→ Melhoria de desempenho com GCS + NFS - Quando o volume de metadados cresce, as operações do Airflow podem ficar lentas
→ Uso de política de retenção definida para 28 dias - Pode ser difícil vincular DAGs a usuários e equipes
→ Uso de um repositório centralizado de metadados - Autores de DAGs têm muitas permissões
→ Uso de política de DAG - É difícil garantir balanceamento de carga consistente
→ Gerar agendamentos padronizados para reduzir picos de tráfego - Existem vários pontos de contenção de recursos
→ Uso de Pools, Priority Weight, Celerey Queue e Isolated Workers
Ainda não há comentários.