1 pontos por GN⁺ 2023-11-29 | 1 comentários | Compartilhar no WhatsApp

Meu erro de US$ 500 milhões com o rover de Marte: uma história de fracasso

  • Em fevereiro de 2003, uma noite rotineira começava no Jet Propulsion Laboratory (JPL) da NASA.

  • Faltavam duas semanas para o rover marciano Spirit ser transportado para Cape Canaveral, na Flórida, para o lançamento.

  • Spirit e Opportunity estavam entre as espaçonaves mais complexas da época, com quase US$ 1 bilhão investido pela NASA.

  • O rover de Marte era equipado com 62 motores para tração e esterçamento das rodas, controle do braço robótico, apontamento das câmeras, direcionamento da antena voltada para a Terra e muito mais.

  • O rover passou por testes extensivos que simulavam o ambiente severo de Marte.

  • Em especial, eram importantes os eventos pirotécnicos, nos quais ondas de choque explosivas podiam danificar componentes de carbono vulneráveis dentro dos motores.

  • O estado interno dos motores podia ser verificado examinando seu desempenho elétrico.

  • Os testes foram realizados várias vezes, e Chris, experiente, era a pessoa certa para essa campanha de testes por ser responsável por escrever as instruções de conexão e controle dos motores.

  • Durante os testes, Chris cometeu o erro de enviar acidentalmente uma sobrecarga elétrica para a espaçonave, e não para o rover.

  • Por causa desse erro, a situação chegou ao ponto de uma espaçonave de US$ 500 milhões poder ter de ser descartada.

  • Chris relatou a situação imediatamente, mas parecia que toda a telemetria da espaçonave havia sido perdida.

  • Chris pensou que, por causa de seu erro, talvez apenas um rover pudesse ser lançado naquela janela de lançamento.

  • Ele desabafou sobre o incidente com a esposa, convicto de que perderia o emprego no dia seguinte.

  • No dia seguinte, a equipe revisou o incidente cuidadosamente e concluiu que a sobrecarga elétrica provavelmente tinha ido para o circuito do driver de motor em ponte H.

  • Decidiram ligar a espaçonave novamente e retomar os testes.

  • A telemetria da espaçonave voltou, e ficou claro que o Spirit não estava morto.

Lições

  • Ao compartilhar essa história, Chris oferece lições valiosas para si mesmo e para os outros.

  • Seu relato de fracasso também teve um papel importante na cultura da equipe e no processo de contratação.

  • Chris expressa assim a lição que tirou de sua experiência: "Deixe que suas cicatrizes trabalhem a seu favor; elas são experiências de aprendizado valiosas e um investimento em sua capacidade e resiliência."

  • No momento da crise, um colega se aproximou de Chris, ofereceu palavras de conforto e o aconselhou a se lembrar dessa sensação na próxima vez em que aprovasse algo como estando ok.

  • Depois desse incidente, Chris se tornou diretor de voo do Spirit e do Opportunity e recebeu a Medalha de Excelência da NASA.

  • O gerente do projeto acreditava que Chris nunca repetiria o mesmo erro e decidiu que ele continuaria liderando os testes.

  • Chris continuou realizando muitos testes depois disso, revisando cuidadosamente os procedimentos para não repetir o mesmo erro.

  • Sempre que toma uma decisão importante, ele se lembra daquele momento e se dedica a ajudar outras pessoas a atravessar seus próprios momentos desafiadores.

  • Na exploração espacial, o fracasso não é uma opção, e sim algo embutido por padrão; cada erro é um degrau rumo a um sucesso maior.

  • Chris quer ouvir e aprender com as "histórias de fracasso" de outras pessoas, como empreendedores espaciais, engenheiros, cientistas e técnicos.

Opinião do GN⁺

O ponto mais importante deste texto é o valor do aprendizado e do crescimento por meio do fracasso. A história de Chris mostra como é importante reconhecer que o fracasso é uma parte inevitável do processo e como as lições e a confiança obtidas ao superá-lo podem ser valiosas. Este texto oferece inspiração especialmente para engenheiros de software em início de carreira, mostrando que não é preciso ter medo de falhar e que isso pode se tornar uma oportunidade de crescimento. Além disso, a experiência de Chris destaca a importância do trabalho em equipe e da liderança, mostrando como uma cultura de apoio e confiança mútua é essencial mesmo em situações difíceis. Histórias como essa têm elementos úteis, positivos, interessantes, divertidos e envolventes, e devem despertar o interesse de muitas pessoas.

1 comentários

 
GN⁺ 2023-11-29
Comentários do Hacker News
  • Experiência de um engenheiro mecânico/aeroespacial

    Como revisor de segurança responsável por vidas humanas, sente medo ao analisar fotos de peças danificadas em acidentes, pensando se um erro de cálculo seu ou um procedimento de teste inadequado pode ter sido a causa. Esse tipo de experiência traz, para algumas pessoas, um peso psicológico semelhante a PTSD.

  • História de erro de um engenheiro de software

    No dia do lançamento de uma nova versão do serviço web de um cliente, há 10 anos, durante um processo de deploy manual e complexo, apagou por engano o banco de dados de produção. Felizmente, graças aos backups, foi possível recuperar a maior parte dos dados. Depois disso, passou a ter extremo cuidado ao lidar com bancos de dados e sistemas de produção.

  • Erro de um estagiário e problema de processo

    Se um estagiário apagou o banco de dados de produção, o problema não é do estagiário, e sim do processo. Embora se espere mais de um funcionário em tempo integral (FTE), reconhece-se, por meio desses erros, a importância da esperança de conseguir se reerguer.

  • Segurança de bancos de dados e a ameaça de hackers

    Se um erro de uma única pessoa pode derrubar todo o sistema, o mesmo risco também existe para hackers. Medidas de segurança como credenciais separadas, segregação de acesso e proibição de comandos perigosos são importantes.

  • Experiência de um operador de fitas em uma emissora de TV

    Aprendeu a ser cuidadoso por meio da forma como o treinador chamava atenção para evitar o erro de retirar a fita errada durante a transmissão. As punições por erros eram severas, mas, graças a isso, construiu a carreira sem cometer esse tipo de falha.

  • Citação de Thomas J. Watson

    Em vez de demitir um funcionário que causou um grande prejuízo à empresa, valorizou o que foi aprendido com essa experiência.

  • Importância da correlação entre incidentes

    Ao comparar timestamps exatos quando ocorre um incidente, é possível evitar preocupações desnecessárias. Destaca-se a importância do uso preciso da linguagem e de verificar a correlação entre eventos.

  • Acidente com o satélite NOAA-N Prime

    Houve um acidente em que o satélite caiu porque parafusos caros foram “emprestados” para outro projeto e não foram devolvidos. O custo do reparo do acidente chegou a US$ 135 milhões.

  • Excesso de trabalho e possibilidade de erro

    Permitir turnos de 12 horas para tarefas importantes é um erro. É perigoso reconhecer a possibilidade de erros, mas ainda assim depender apenas da capacidade humana.

  • Projeto de conectores elétricos e a complexidade dos controladores de motor

    Reconhece-se a importância de projetos que usam conectores de tamanhos e formatos diferentes para evitar ligações incorretas. Também se reconhece a cadeia complexa de falhas e a necessidade de redesenho resultante disso.