13 pontos por GN⁺ 19 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • John Carmack, criador de Doom/Quake, disse que admira Fabrice Bellard

    "É quase certo que ele seja muito melhor do que eu em programação de forma geral"

  • Isso foi deixado como comentário citando um texto que alguém escreveu ao compartilhar a página da wiki de Fabrice Bellard

Um engenheiro francês que vive discretamente em Paris escreveu, ao longo de 30 anos e sem ficar famoso, software do qual toda a internet de hoje depende

  • Grande parte do código central que sustenta o streaming de vídeo mundial e a virtualização em nuvem é baseada em open source criado sozinho por um engenheiro em Paris, fora do Vale do Silício
  • O FFmpeg, que processa formatos de vídeo e áudio, funciona como o motor invisível da internet em YouTube, Netflix, VLC e outros
  • O emulador de máquinas QEMU é a base da virtualização moderna; sobre ele roda o hipervisor Linux KVM, e a infraestrutura de VM das principais nuvens foi construída em cima disso
  • Além disso, ele desenvolveu sozinho vários projetos como TCC, JSLinux, QuickJS e NNCP, e calculou o então maior número de dígitos de pi da história com uma fórmula que ele mesmo derivou
  • Sem marketing nem redes sociais, atua como CTO da empresa de telecom Amarisoft e continua lançando projetos pessoais até hoje

Visão geral da pessoa

  • O nome é Fabrice Bellard, nascido em 1972 em Grenoble, França
  • Estudou na École Polytechnique, uma das principais escolas de engenharia da França
    • Nunca se mudou para o Vale do Silício nem construiu um império de startups; concentrou-se em escrever código
  • Não usa Twitter nem Instagram e quase não dá entrevistas
    • Seu site pessoal é uma lista simples de títulos de projetos e links, sem estilo, fonte especial ou frases de marketing

FFmpeg — o motor invisível da internet

  • Framework multimídia open source para codificação, decodificação e streaming, iniciado em 2000 quando ele tinha 28 anos
    • Implementou sozinho a ideia de processar praticamente todos os formatos de vídeo e áudio existentes, em uma única biblioteca, em todos os sistemas operacionais
    • Liderou diretamente o projeto por anos
  • Hoje é usado por YouTube, Netflix e VLC, e Chrome e Firefox também usam partes dele
    • O FFmpeg roda dentro de todos os celulares Android, iPhones, smart TVs e ferramentas de edição de vídeo
    • Se você assistiu a vídeo em uma tela nos últimos 20 anos, é bem provável que esse código tenha processado esse vídeo

QEMU — a base da virtualização moderna

  • Emulador de máquinas e ferramenta de virtualização iniciado em 2003, escrito sozinho até a versão 0.7.1 em 2005
    • Permite executar qualquer sistema operacional sobre outro sistema operacional
  • O hipervisor do kernel Linux KVM roda sobre o QEMU
    • AWS, Google Cloud, Microsoft Azure, IBM Cloud e todos os principais provedores de nuvem executam VMs em infraestruturas construídas com base nisso
    • É considerado um dos códigos de infraestrutura de nuvem mais amplamente adotados do planeta

Outros principais projetos solo

  • Em 2001, a obra vencedora do International Obfuscated C Code Contest, um pequeno compilador C, evoluiu para o TCC (Tiny C Compiler)
    • O TCC consegue compilar e iniciar o kernel Linux a partir do código-fonte em menos de 15 segundos
  • Em 2004, calculou o então maior número de dígitos de pi da história com um computador desktop pessoal e o algoritmo da Bellard's formula, derivado por ele mesmo
  • Em 2011, lançou o JSLinux, um emulador de PC escrito em JavaScript puro que roda Linux no navegador
  • Em 2019, lançou o QuickJS, um motor JavaScript pequeno e completo adequado para ambientes onde o V8 não cabe
  • Em 2021, lançou o NNCP, um compressor de dados sem perdas baseado em redes neurais, que assumiu imediatamente a liderança no Large Text Compression Benchmark

Projetos relacionados a LLM

  • Criou o TextSynth Server, um servidor web com API REST para executar LLM localmente
  • Lançou ts_zip e ts_sms, que usam modelos de linguagem para comprimir textos e mensagens curtas com taxas que algoritmos anteriores não conseguiam alcançar
  • Lançou o TSAC, um sistema de compressão de áudio de bitrate muito baixo
  • Em dezembro de 2025, lançou o Micro QuickJS, um motor JavaScript para microcontroladores, feito separadamente do QuickJS, voltado a ambientes com quase nenhuma memória

Amarisoft e forma de atuação

  • Em 2012, cofundou a empresa de telecom Amarisoft e atua como CTO
    • A Amarisoft desenvolve software de estação rádio base 4G e 5G usado por operadoras e centros de pesquisa no mundo todo
  • Mesmo tocando a empresa há mais de 10 anos, continua distribuindo projetos pessoais por meio do seu site (bellard.org)
    • Sem se mudar para o Vale do Silício, ele continua lançando discretamente código que sustenta a internet até hoje

1 comentários

 
Comentários do Hacker News
  • Ao olhar a lista de contribuições do Bellard, a capacidade pura já é impressionante, mas o que mais se destaca é o faro para saber o que escolher
    Ele continuou escolhendo trabalhar em coisas que acabariam sendo úteis para um número enorme de pessoas, e isso parece ainda mais surpreendente do que a habilidade técnica em si
    Talvez a pergunta mais importante da vida seja decidir o que fazer

    • O critério provavelmente é algo como quero fazer uma coisa simples, então por que isso é tão difícil?
      Na computação moderna há pântanos demais de experiência do desenvolvedor, e embora todo mundo passe por isso, quase ninguém realmente parte para consertar
      Em resumo, é uma filosofia de “coisas que deveriam ser boas não são tão boas, e eu posso aprender e torná-las melhores”, ou, de forma mais ampla, algo próximo de “você pode simplesmente fazer”
    • Quando algo que tradicionalmente era difícil fica muito mais fácil, mais rápido e melhor, os casos de uso que estavam bloqueados por baixo disso se liberam
      Tanto a escolha quanto a execução importam, mas muitas indústrias se abriram porque alguém tornou fácil algo que antes era difícil
    • Na pesquisa, o mesmo dilema aparece com frequência
      Especialmente se você quer causar impacto, é importante escolher no que vai gastar o tempo da vida toda, e muitas vezes escolher o problema certo é mais difícil do que imaginar a solução adequada
    • Esse é o tipo de pessoa que seria um desenvolvedor 10x
      No caso do Bellard, talvez passe de 100x
      Não por trabalhar 19 horas por dia, aumentar linhas de código ou número de PRs, mas por apresentar soluções elegantes de impacto amplo que ninguém mais havia imaginado
    • Por outro lado, se você tem capacidade, basta escolher e resolver o problema mais difícil da sua área, e repetir isso
      Os problemas difíceis de cada área não são segredo; no fim, a questão é se você tem a capacidade, a coragem e a determinação para dedicar anos a esse tipo de problema
  • Curiosamente, grande parte do trabalho do Bellard parece ser pegar especificações e traduzi-las para C
    Entre os projetos importantes estão ffmpeg (especificações de codecs), qEmu (especificações de conjunto de instruções), QuickJS (especificação do EcmaScript), tinyC (especificação de C) e operadoras de telecomunicações (especificação de LTE), sendo cálculo de pi e trabalho com redes neurais algo mais próximo de exceções
    Isso não quer dizer que seja menos impressionante, e implementar codecs e emuladores de alto desempenho está longe de ser fácil, mas é interessante como muito do trabalho se concentra em um domínio relativamente estreito

    • No caso de especificações de telecomunicações em que um par codificador/decodificador se comunica por um canal, é preciso notar que a especificação em geral define apenas o codificador
      O padrão deixa o decodificador deliberadamente em aberto para permitir avanço técnico e competição entre implementações, e o decodificador normalmente é mais complexo porque precisa lidar com o ruído e os efeitos do canal
      Por isso, uma implementação competitiva e aderente ao padrão de um decodificador não é seguir um caminho já definido, mas algo mais próximo de P&D; Bellard parece menos um programador puro e mais um engenheiro que programa
    • A ideia de que alguém escreve a especificação do codec e o Fabrice Bellard simplesmente a converte para C está completamente errada
      Em geral, codecs são implementados por engenharia reversa, e às vezes nem há especificação; mesmo quando o codec é documentado, isso não informa os métodos eficientes de codificação e decodificação
      É justamente esse tipo de algoritmo eficiente que pessoas como Bellard desenvolvem
    • Originalmente, fui treinado em um contexto em que especificação, implementação e teste eram áreas separadas, e às vezes até feitas por pessoas diferentes
      Hoje em dia costuma-se misturar as três, e acho que o resultado é bom
      Ainda assim, hoje muita gente parece fazer só a implementação
    • Antigamente, gastava-se um tempo enorme definindo especificações para poder terceirizar o código
      Agora é como se estivéssemos terceirizando a especificação para poder gastar um tempo enorme com o código
    • Quando você realmente mexe no ffmpeg, a arquitetura é bastante impressionante de tão plugável
      Os codecs têm muitas divergências e esquisitices já nos conceitos básicos, e até o que é um “frame” varia entre os mundos de áudio, legenda e vídeo; a forma de passar frames também é totalmente diferente entre codificadores de software e hardware
      Conseguir misturar quase livremente o processamento desses mundos tão diferentes é uma grande conquista, e o libav parece ter sido projetado bem o bastante para tornar isso possível
  • Bellard já não se envolve com o FFmpeg há mais de 20 anos; na prática, mais perto de 23 anos
    Na época, o FFmpeg não tinha um framework de compartilhamento de código entre componentes e codecs, então o código dele não era bom, tinha cheiro de código espaguete, e hoje quase nada do código dele resta
    O FFmpeg de hoje se tornou o que é graças a outros desenvolvedores, e mesmo assim ele é tratado como se fosse o único ditador benevolente vitalício e os demais desenvolvedores apenas tivessem construído sobre a estrutura sábia dele
    Hoje o que ele faz é basicamente deter a marca e decidir que projeto ou líder pode usar o nome FFmpeg, e ele já excluiu os desenvolvedores do libav uma vez para apoiar outro ditador

    • Não dá para esquecer o contexto
      FFmpeg e Videolan começaram em quartos de dormitório, e estudantes os usavam para transmitir TV e compartilhar filmes no dormitório
      Os campi da Polytechnique e da École Centrale ficam a apenas alguns km de distância, e os dois projetos começaram por volta de 1997~1998
      Se fosse na época de estudante, eu provavelmente estaria mais ocupado bebendo cerveja do que escrevendo código limpo
    • Não estamos falando de “copyright”, mas de marca registrada
      O copyright fica com quem escreveu o código ou com seu empregador, já que não há exigência de cessão de direitos autorais
      É parecido com o fato de Linus Torvalds deter a marca “Linux” em algumas jurisdições, enquanto a maior parte dos direitos autorais pertence a outros contribuidores
    • Encontrei um comentário de 15 anos atrás sobre o drama ffmpeg/libav: https://www.reddit.com/r/linux/comments/vvdxn/comment/c57zdk...
      Não conheço bem ffmpeg, mas isso se conecta com o que vivi em outros projetos open source
    • O ffmpeg hoje é um projeto open source bem-sucedido demais para dar todo o crédito a uma única pessoa
      Também me lembro de uma época em que o AviDemux tinha uma implementação de codificador H.264 muito mais rápida e melhor que a do ffmpeg
      No melhor espírito open source, o ffmpeg absorveu o código do AviDemux, e no fim o próprio AviDemux tomou a decisão pragmática de usar ffmpeg como backend em vez de competir
      Acho que é um bom exemplo de adoção do espírito open source
    • Nenhuma pessoa em sã consciência acharia que o ffmpeg ainda é mantido e desenvolvido por uma única pessoa, especialmente o Fabrice sozinho
      Se era código espaguete ou não, isso não importa tanto no começo
      Quando ainda não se conheciam o escopo e o futuro do projeto, pode ter feito sentido começar em modo espaguete em vez de se deixar arrastar por problemas potenciais do futuro, e depois refatorar quando os requisitos estivessem mais claros
      É excelente que a comunidade tenha feito exatamente isso
  • O site do Fabrice pode ser visto aqui: https://bellard.org/
    Tem a lista completa de projetos

    • Programadores excelentes muitas vezes também têm um ótimo design de site pessoal
      Tudo é muito claro e não há absolutamente nenhuma redundância desnecessária
  • O Bellard tem um projeto muito interessante chamado ts_zip, que é um algoritmo de compressão baseado em LLM
    É só um “experimento” e não deve ser usado em produção, mas é muito inteligente
    A descrição no site também é divertida: “The ts_zip utility can compress (and hopefully decompress) text files using a Large Language Model”
    https://bellard.org/ts_zip/

    • Se descompressão for opcional, eu também consigo pensar num algoritmo de compressão realmente impressionante
    • Na verdade, LLM é exatamente isso
      O modelo mental na minha cabeça, e a metáfora que eu usaria para explicar a uma criança, é: “comprimimos a internet inteira num arquivo tipo zip, e existe um jeito muito inteligente e eficiente de encontrar dados lá dentro”
      Já vivi o bastante para lembrar da época em que se encomendava a Wikipedia em CD, e não sinto tanta diferença entre aquilo e baixar um LLM
    • Existe a área de algoritmos de compressão competitivos que não liga para tempo nem custo computacional
      Já houve gente que fez compressores que levam horas, talvez dias, para comprimir um corpus de teste
      A velha piada que funciona como limite superior nessa área é que compressão seria “AI-complete”; por exemplo, em vez de comprimir o texto das obras completas de Shakespeare, você codifica apenas “The Complete Works of Shakespeare”, e um descompressor com IA regenera a saída a partir desse prompt
      Com a chegada dos LLMs, Bellard basicamente transformou essa piada em realidade
  • “Fabrice Bellard” by Andy Gocke and Nick Pizzolato
    https://www.ipaidia.gr/wp-content/uploads/2020/12/117-2020-f...

    • Fico me perguntando se esse Nick Pizzolato é o mesmo que escreveu True Detective
    • É um material bem antigo, porque depois disso ele fez muito mais coisa
    • Se isso nunca foi enviado ao HN, vale a pena enviar
  • Eu ficava curioso se, ao perguntar a alguém “quem é a pessoa viva mais inteligente?”, depois perguntar o mesmo para a pessoa indicada, e assim por diante, isso acabaria convergindo para o mesmo pequeno grupo de gênios
    Se fosse sobre o melhor programador vivo, acho que daria para começar com Carmack, e o próximo teria de ser Bellard
    Só espero que a resposta do Bellard não seja Carmack de novo

    • Existe uma história parecida em que, seguindo os cientistas e físicos do Manhattan Project, no fim a resposta acaba sendo John von Neumann
    • Da época em que eu trabalhava na Apple, consigo pensar em umas dez pessoas que eu escolheria imediatamente
  • Foi a primeira vez que vi uma foto dele, e dá um pouco a sensação de ver a identidade de Satoshi Nakamoto revelada, de alguém que protege a própria privacidade e evita atenção
    A impressão é de alguém que sempre tinha coisas melhores para fazer do que interagir na grande internet: pensar bastante e resolver problemas difíceis
    O trabalho em si é admirável, mas a ética de trabalho é ainda mais admirável
    Se você tem uma visão forte, talvez seja preciso um desenvolvimento em estilo torre de marfim, em vez de passar o dia inteiro discutindo com desconhecidos na internet e defendendo suas escolhas

    • Ele nunca escondeu a identidade
      Dava para achar fotos dele se você procurasse
      Não deveria ser comparado com Satoshi
      Não tenho Bitcoin, nem interesse nisso, mas esse nome é uma presença lendária estampada no documento original
      Fabrice Bellard é uma pessoa real que publica código, não uma identidade anônima da internet
    • Bellard é Mozart, e a maioria de nós mal conseguiria ser Salieri
    • Carmack e Bellard viraram ambos figuras mitificadas
      Os dois são excelentes, mas assim que o nome aparece as pessoas começam a falar de expectativas estranhas, tipo “o que eles pensariam”, mais do que do que realmente fizeram
      Esse processo de mitificação acaba até diminuindo as conquistas
    • É uma pena que ele não tenha demonstrado o mesmo respeito por Rebecca Ann Heineman, a “Burguer”
    • Eu imaginava que ele talvez fosse uma pessoa rude, de cabelo comprido, talvez com tatuagens, grande e pesada
      A foto destruiu essa imaginação, e agora eu queria minha imaginação de volta
  • Eu entendo o que querem dizer com “hoje o FFmpeg é o motor invisível da internet”, mas odeio esse exagero
    Mesmo que o FFmpeg desaparecesse de repente, a internet continuaria perfeitamente bem
    As empresas que dependem dele no núcleo dos produtos poderiam sofrer, mas a própria internet e a maioria dos sites e serviços online continuariam funcionando normalmente

    • É o jeito como LLM escreve
      Aquele tuíte/post foi escrito por um LLM, e escreve desse jeito
    • Sem YouTube e pornô, isso ainda seria mesmo a internet?
    • Se você pensar como o motor invisível de grande parte do que compõe a internet hoje, aí acho que não é exagero
      A internet de amanhã pode ser diferente
  • Totalmente tangencial, e assumindo os downvotes, essa onda recente de X-artigos está me irritando profundamente
    No celular, você precisa passar por 3 ou 4 etapas até chegar ao texto, e os textos sempre parecem superotimizados para engajamento de leitores com atenção curta, como posts do LinkedIn
    Além disso, é irônico o contraste gritante entre esse post no X e o próprio site do Bellard

    • É meio triste que pessoas que já são grandes VIPs do setor de tecnologia sintam necessidade de gastar tempo escrevendo esses tuítes ou, pior ainda, contratar uma agência de PR para escrevê-los
      Em outros setores isso é comum para celebridades com patrimônio semelhante, mas para mim continua parecendo estranho