- Plataforma open source de armazenamento distribuído e processamento de big data lançada pela Yandex
- Casos de uso: processamento em lote, análise ad hoc, OLTP, machine learning, armazenamento de metadados, pipelines de ETL
- Ecossistema multitenant
- Confiabilidade e segurança: sem SPOF. Replicação automática entre servidores. Atualizações sem perda de progresso
- Escalabilidade
- Pode escalar para até 1 milhão de núcleos de CPU e milhares de GPUs
- Suporta mais de 10 mil nós. Escala automática de servidores para cima e para baixo
- Suporte a diversos meios de armazenamento até dados em escala de exabytes
- Recursos avançados
- Modelo MapReduce abrangente
- Transações ACID distribuídas
- Fornece vários SDKs (C++, Python, Java, Go) e APIs
- Isolamento seguro para recursos de computação e armazenamento
- UI amigável
- CHYT powered by ClickHouse
- Dialeto SQL familiar e funcionalidades semelhantes
- Consultas analíticas rápidas
- Integração com soluções populares de BI (JDBC/ODBC)
- SPYT powered by Apache Spark
- Ferramentas para criar processos de ETL
- Suporte a vários clusters independentes de diferentes tamanhos
- Migração fácil a partir de soluções existentes
1 comentários
Um artigo de apresentação sobre a história do próprio projeto open source e as tecnologias usadas internamente: YTsaurus: Exabyte-Scale Storage and Processing System Is Now Open Source