- Este artigo apresenta o WarpStream, uma plataforma de streaming de dados compatível com o protocolo Kafka construída diretamente sobre o S3.
- O WarpStream é fornecido como um único binário Go sem estado, eliminando a necessidade de gerenciar discos locais, rebalanceamento de brokers e operação do ZooKeeper.
- Ao transmitir os dados diretamente para o S3, a plataforma reduz significativamente os custos de infraestrutura e, na nuvem, é de 5 a 10 vezes mais barata que o Kafka.
- O artigo critica a adequação do Kafka para cargas de trabalho modernas, destacando os altos custos de largura de banda entre AZs e a sobrecarga operacional.
- A arquitetura do WarpStream é diferente da do Kafka. Em vez de brokers, há "agentes" sem estado que podem atuar como "líder" de qualquer tópico, fazer commit de offsets para qualquer grupo de consumidores ou funcionar como coordenador do cluster.
- No WarpStream, todo o armazenamento é descarregado para um armazenamento de objetos como o S3, permitindo escalabilidade fácil e recuperação rápida de falhas.
- O WarpStream separa dados e metadados, armazenando os metadados de todos os "clusters virtuais" em um banco de dados de metadados personalizado.
- A plataforma reduz em 5 a 10 vezes o custo total da maioria das cargas de trabalho com Kafka, mas tem latência mais alta: P99 de cerca de 400 ms para requisições de produção e cerca de 1 segundo do produtor ao consumidor.
- O WarpStream está atualmente na fase de prévia para desenvolvedores e ainda não está pronto para uso em produção.
- Os criadores do WarpStream acreditam que a UX para desenvolvedores do Kafka é um problema, especialmente por causa da abstração de baixo nível das partições. Eles planejam resolver isso em futuras atualizações do WarpStream.
- O artigo termina convidando os leitores a experimentar o WarpStream e enviar feedback.
1 comentários
Comentários do Hacker News