7 pontos por GN⁺ 2023-11-21 | 4 comentários | Compartilhar no WhatsApp
  • A OneUptime, uma plataforma de observabilidade open source, migrou sua infraestrutura da AWS para uma solução bare metal, obtendo maior controle sobre os recursos e uma economia financeira significativa.
  • Como a maioria dos clientes usa nuvem pública, era necessário um data center independente para fornecer serviços de alerta em caso de falha da nuvem.

Configuração inicial: Kubernetes na AWS

  • Adoção de um cluster Kubernetes usando o Elastic Kubernetes Service (EKS) gerenciado da AWS.
  • A OneUptime foi construída com base em softwares open source não específicos da AWS, como Redis, Postgres, Clickhouse, Docker, NodeJS e BullMQ.
  • Isso evitou dependência da AWS e permitiu que os clientes fizessem self-host do OneUptime em seus próprios clusters.

Transição: migração para bare metal

  • A decisão de migrar para uma solução bare metal foi tomada como parte da busca por excelência técnica.
  • A empresa optou por operar um cluster Microk8s em uma instalação de colocation, com base em experiências passadas e em objetivos voltados para o futuro.
  • O Microk8s também pode ser usado em produção, e a migração para servidores bare metal permite recursos dedicados e otimização de desempenho.

O papel do Kubernetes e do Helm

  • Kubernetes e Helm tiveram papel importante na transição da nuvem para servidores próprios.
  • Kubernetes é uma plataforma open source para automatizar a implantação, o escalonamento e a operação de contêineres de aplicações.
  • Helm é um gerenciador de pacotes que simplifica a definição, instalação e atualização de aplicações Kubernetes.

Armazenamento e load balancer

  • No cluster Kubernetes em bare metal, os volumes usam Network File System (NFS), e o load balancer usa MetalLB.
  • NFS é um protocolo de sistema de arquivos distribuído que permite que computadores clientes acessem arquivos pela rede.
  • MetalLB é uma implementação de load balancer para clusters Kubernetes em bare metal que usa protocolos de roteamento padrão.

Impacto financeiro: mais de US$ 230 mil de economia por ano

  • Na AWS, o gasto era de mais de US$ 38 mil por mês, ou mais de US$ 456 mil por ano.
  • Após a migração para bare metal, foi usada uma configuração de rack único com um parceiro de colocation, reduzindo o custo operacional mensal para cerca de US$ 5,5 mil.
  • Amortizando o custo dos servidores ao longo de 5 anos, a economia ultrapassa US$ 230 mil por ano, permitindo ampliar a equipe e alocar recursos para outras áreas do negócio.

Pontos a considerar

  • Os dados são copiados várias vezes por dia para dois escritórios, e também podem ser salvos em backup na nuvem pública.
  • É possível operar um cluster Kubernetes multi-localização em duas instalações de colocation em continentes diferentes.
  • Há um cluster de backup preparado na AWS, que pode ser ativado em até 10 minutos em caso de desastre.
  • Ao migrar para bare metal, não é obrigatório contratar um administrador de servidores, já que a instalação de colocation cuida da maior parte da manutenção do hardware.
  • O Microk8s é usado não apenas para desenvolvimento, mas também em produção, e pode ser facilmente substituído por outra distribuição Kubernetes se necessário.

Conclusão

  • Serviços de nuvem como a AWS oferecem flexibilidade e poder, mas não são a opção mais econômica para todas as empresas.
  • Com o uso de tecnologias open source e investimento em hardware próprio, é possível aumentar o controle sobre os recursos e reduzir significativamente os custos operacionais.
  • Como cada negócio tem necessidades específicas, é necessária uma avaliação abrangente antes da migração.

Opinião do GN⁺

O ponto mais importante deste texto é o benefício de controle e redução de custos que uma empresa pode obter ao migrar de serviços de nuvem para uma infraestrutura bare metal. O texto é interessante porque mostra, por meio de um caso concreto, como decisões técnicas podem impactar resultados financeiros. Com a evolução de tecnologias como Docker, Kubernetes, Helm e Microk8s, esse tipo de transição ficou muito mais fácil do que há alguns anos, o que reforça a importância das escolhas tecnológicas e o valor de uma abordagem estratégica.

4 comentários

 
hhcrux 2023-11-22

US$ 230 mil... isso não é um dinheiro que vai embora só de contratar dois administradores para cuidar desses servidores em colocation? O motivo de usar serviços totalmente gerenciados é justamente economizar isso.

 
gunrok 2023-11-23

Isso também é verdade, mas a armadilha é que, na AWS, também é preciso ter especialistas por área.

 
wedding 2023-11-21

As avaliações parecem ser, em geral, bastante negativas. Pelo conteúdo resumido, também dá uma sensação de certo exagero.

 
GN⁺ 2023-11-21
Opiniões do Hacker News
  • Usar instâncias reservadas e Savings Plans pode reduzir bastante os custos na AWS. Isso também se aplica a custos de transferência e armazenamento, então dá para economizar bastante na prática, mas a diferença não é tão dramática quanto se imaginava no início.
  • Dada a situação econômica atual, muita gente diz que isso significa “poder contratar mais um engenheiro”, mas é preciso lembrar que também pode significar “conseguir manter mais um engenheiro”. Fica a questão de demitir alguém da equipe para continuar na AWS.
  • Gerenciar racks de servidores não é nada tão extraordinário quanto muita gente pensa. Engenheiros cloud-native relutam em aprender sobre administração de hardware.
  • Se você não usa serviços de nuvem e só usa máquinas virtuais, isso raramente vale a pena. Para muita gente, alugar servidores dedicados pode ser a melhor decisão de negócio. Pode sair muito mais barato que EC2 e, com bastante capacidade ociosa, dá para resolver os problemas normais de escalabilidade.
  • É preciso focar nos objetivos de negócio e não se deixar levar pelo hype. Em alguns casos, downtime é um grande problema, mas para muitos negócios o custo de alguns minutos de interrupção é muito menor do que o custo de projetar mecanismos complexos e caros de alta disponibilidade (HA).
  • Em vez de comprar uma Ferrari na AWS, comprar um Toyota Camry pode economizar muito dinheiro. Esse tipo de história costuma ser spam de blog de empresa dizendo que conseguiu um novo hack incrível. Na prática, só queimaram caixa por não saber controlar os gastos.
  • Parece que foi ontem que estavam procurando um provedor de colocation, então há dúvidas sobre a alegação de que economizaram US$ 230 mil tão rapidamente.
  • Pensando em custo-benefício, se você não estiver gastando um ano-pessoa de esforço para administrar seus próprios servidores, então provavelmente fez a escolha certa.
  • O post é muito breve nos detalhes, então é difícil julgar se isso realmente tem valor.
  • Empresas existem para ganhar dinheiro, e quem gera receita é o produto, não a capacidade de administrar hardware e infraestrutura de TI.
  • Gastar US$ 500 mil por ano na AWS pode significar que sair da nuvem realmente faça sentido, se a infraestrutura for relativamente simples e não houver expectativa de que os gastos cresçam muito.
  • Gastar US$ 500 mil por ano na AWS já é um nível em que basta colocar os valores numa planilha e revisar por uma hora para ver que há economias óbvias possíveis, e isso deveria ser feito antes de gastar centenas de milhares de dólares por ano na AWS.