- A infraestrutura do LinkedIn é composta por centenas de milhares de servidores distribuídos por vários data centers
- À medida que a infraestrutura cresceu, a observabilidade se tornou ainda mais importante para identificar com precisão as causas potenciais de falhas e anomalias na infraestrutura
- Com eBPF, é possível extrair diretamente as informações desejadas minimizando a sobrecarga
- O LinkedIn deu ao seu agente eBPF o nome de Skyfall e o executa em quase todos os servidores
Skyfall
- Coleta informações relacionadas aos protocolos TCP/UDP com
kprobes e kretprobes
tcp_set_state, tcp_v4_connect, tcp_v6_connect, inet_csk_accept
ip4_datagram_connect, ip6_datagram_connect
- Envia os dados coletados via UDP para o InFlow (plataforma interna de coleta/visualização de fluxos)
- No InFlow, envia para o Kafka, armazena no HDFS e salva no Graph Data Store por meio do Samza
1 comentários
Eu já expliquei o eBPF anteriormente no podcast do GeekNews.
→ https://www.youtube.com/watch?v=aCw0YwEHpCU&t=1892s