Sobrevivência do software 3.0 – o que precisa ser construído para sobreviver

(steve-yegge.medium.com)

45 pontos por GN⁺ 2026-02-05 | Ainda não há comentários. | Compartilhar no WhatsApp

Na era em que a IA escreve todo o software, sobreviverão os softwares que economizam tokens (custo de inferência) por meio de pressão seletiva evolutiva
A aptidão do software pode ser medida pela fórmula da taxa de sobrevivência, e ele só sobrevive quando a economia cognitiva supera o custo cognitivo (isto é, quando passa de 1)
Ferramentas como Git e grep são casos em que o custo para a IA recriar e usar novamente seria absurdamente alto, graças à compressão de insight e à eficiência do substrato
Para que agentes adotem ferramentas, são essenciais consciência (Awareness) e fricção mínima (Friction), e o design baseado em Desire Paths é eficaz
Mesmo em uma era centrada em IA, o coeficiente humano (Human Coefficient) continua valendo: áreas em que a intervenção e a preferência humanas geram valor direto continuarão sobrevivendo

Contexto: previsões sobre software na era da IA

Desde junho de 2024, com Death of the Junior Developer, a previsão da chegada dos orquestradores 10 meses antes e projetos como Gas Town, o autor vem acertando consistentemente a curva de evolução da IA
O desenvolvimento do Gas Town foi uma extrapolação da sequência: autocompletar código em 2023 → interfaces conversacionais em 2024 → agentes no início de 2025 → orquestração no início de 2026
A base de todas essas previsões é levar a sério a curva de avanço exponencial
Há confiança total na direção descrita por Dario Amodei e Andrej Karpathy sobre o futuro do software
O Gas Town mostrou um caso em que essa extrapolação realmente funciona, verificando primeiro uma forma que mal se sustenta, usando modelos do fim de 2025 e vários remendos temporários

Ecossistema de software sob ameaça

A pressão sobre empresas SaaS está aumentando, e a estrutura de custos entre comprar e construir mudou, levando áreas de negócio a criarem seu próprio SaaS diretamente com vibe coding
Há apenas 3 anos, o GPT-3.5 mal conseguia escrever uma única função; hoje já é possível gerar diretamente SaaS pequenos, mas com valor real
Stack Overflow e Chegg sofreram os primeiros impactos, e depois a pressão se espalhou para software de suporte ao cliente Tier-1, sistemas low-code e no-code, ferramentas de geração de conteúdo e vários tipos de ferramentas de produtividade
Fornecedores de IDE também começaram a sentir pressão competitiva após o surgimento do Claude Code
Como as previsões de pesquisadores de IA mostraram alta precisão ao longo de cerca de 40 anos, é preciso se preparar assumindo que todas as áreas de software podem ser ameaçadas

Modelo de pressão seletiva (Selection Argument)

Inferência exige tokens, o consumo de tokens leva ao uso de energia, e energia se converte em custo
{tokens, energia, dinheiro} podem ser tratados como a mesma restrição de recursos, sempre limitada
A regra simples de que sobrevive o software que reduz custo cognitivo molda todo o ecossistema de software
É a mesma estrutura da pressão seletiva evolutiva em que, num ambiente de recursos limitados, entidades que usam recursos com mais eficiência expulsam as menos eficientes

Fórmula da taxa de sobrevivência (Survival Ratio)

Survival(T) ∝ (Savings × Usage × H) / (Awareness_cost + Friction_cost)
Savings: custo cognitivo economizado ao usar a ferramenta, isto é, a quantidade de tokens poupada em comparação com sintetizar a mesma funcionalidade do zero
Usage: frequência e amplitude de aplicação com que a ferramenta pode ser reutilizada em diferentes contextos
H (Human Coefficient): coeficiente que reflete a demanda que atribui valor ao que foi feito por humanos, independentemente da eficiência
Awareness_cost: energia gasta para o agente saber que a ferramenta existe, se lembrar dela e escolhê-la no momento certo
Friction_cost: energia consumida por erros, falhas, novas tentativas e mal-entendidos durante o uso real
A taxa mínima para sobreviver é 1, e em ambientes competitivos o valor exigido é muito maior
- Ex.: uma ferramenta com taxa de sobrevivência de 1,2 pode ser superada por uma concorrente que marque 2,5

Alavanca 1: compressão de insight (Insight Compression)

O setor de software comprime em forma reutilizável conhecimento acumulado ao longo de muito tempo e caro demais para ser redescoberto
Git é o exemplo clássico: DAG de commits, referências (ref) como ponteiros, índice, reflog etc. são estruturas que condensam décadas de tentativa e erro
- Para uma IA reimplementar isso do zero, ela teria de refazer a mesma história intelectual, o que não faz o menor sentido economicamente
O mesmo princípio se aplica a bancos de dados, compiladores, sistemas operacionais, motores de workflow e sistemas de monitoramento
O Kubernetes não é complexo por escolha de design, mas porque sistemas distribuídos são intrinsecamente complexos
O Temporal oferece execução durável (durable execution) porque implementar manualmente o padrão saga com retries idempotentes é, na prática, algo próximo de um projeto de pesquisa
A característica comum de softwares fortes é uma densidade de insight tão alta que a simples tentativa de ressintetizá-los parece absurda
No Gas Town, o modelo de papéis de personagem e verbos como gt sling também são exemplos de compressão de conceitos complexos em expressões curtas e fáceis de memorizar

Alavanca 2: eficiência do substrato (Substrate Efficiency)

grep é outro caso em que reinventar a roda é praticamente loucura
Embora simples o bastante para Ken Thompson criar em uma tarde, ele economiza um enorme custo cognitivo por meio de processamento em CPU
Em correspondência de padrões de texto, a CPU supera a GPU por várias ordens de magnitude
O modo como LLMs fazem multiplicação é combinar correspondência de padrões para estimar primeiro algo como “mais ou menos 94” e depois corrigir os dígitos com tabelas de consulta memorizadas
- Tudo isso é executado sobre o substrato extremamente ineficiente da inferência em GPU
Calculadoras, parsers, ferramentas complexas de transformação como ImageMagick e muitos utilitários Unix CLI exploram fortemente essa alavanca
Aplicar bons algoritmos ou mover o cálculo para substratos mais baratos, como CPU ou humanos, economiza tokens e energia

Alavanca 3: utilidade ampla (Broad Utility)

Corresponde ao termo Usage no modelo de taxa de sobrevivência
Quanto mais amplo o uso, mais o custo de consciência se dilui e menor fica o limiar de economia de tokens exigido em cada uso individual
Ferramentas realmente gerais de economia de tokens tendem a ser priorizadas mesmo que a IA pudesse reimplementá-las em teoria, porque já estão em toda parte e são amplamente usadas
O Temporal, apesar de custos relativamente altos de consciência e fricção, oferece um modelo de workflow tão geral quanto o PostgreSQL
- Ele reúne as três alavancas: compressão agressiva de insight, uso habilidoso do substrato computacional e utilidade ampla
O Dolt é um banco de dados versionado com Git, mantido como projeto open source há 8 anos
- Encontrou tardiamente um killer app em workflows de produção e DevOps baseados em agentes
- Mesmo que agentes errem em produção, é possível fazer rollback e rollforward usando todo o conjunto de capacidades do Git
Motores de busca de código ganharam importância rapidamente porque LLMs passaram a gerar de 10x a 100x mais código que antes
- Surgiu um nicho amplo e geral do tipo “grande demais para o grep dar conta”
- Eles resolvem problemas não triviais, cheios de edge cases difíceis de descobrir, usam substratos computacionais baratos e têm aplicação geral, então atendem às três alavancas

Alavanca 4: publicidade (Publicity)

Economizar custo cognitivo não basta; é preciso resolver o problema de consciência, isto é, a etapa anterior à seleção
O Dolt tinha as alavancas 1 a 3, mas no início não conseguiu ampla adoção por falta da alavanca 4
Existem várias formas de pagar esse custo de consciência
- Construir um ótimo produto, ganhar popularidade e esperar que ele entre naturalmente nos dados de treinamento por meio da comunidade
- Ou investir recursos em documentação para agentes ou publicidade
De forma mais direta, pode-se colaborar com responsáveis de laboratórios de fronteira como OpenAI, Anthropic e Google para incluir a ferramenta no treinamento dos modelos
- Como serviço pago, cria-se um eval mostrando tanto o uso correto quanto o uso indevido da ferramenta, e os pesquisadores ajustam o treinamento
O conceito de SEO para agentes está começando a ganhar corpo
Se não for possível investir grandes orçamentos, resta depender da energia na etapa pós-seleção, isto é, da alavanca 5, o que exige desenhar a ferramenta para ser o mais amigável possível para agentes

Alavanca 5: minimizar fricção (Minimizing Friction)

Se consciência é um problema da etapa pré-seleção, fricção de produto é um problema da etapa posterior ao uso
Agentes agem como se estivessem sempre sem tempo e, quando algo trava, tentam imediatamente um caminho alternativo
Mesmo um pouco de fricção já muda a decisão, levando-os a recuar para métodos menos eficientes, porém familiares e previsíveis
Em contrapartida, ferramentas desenhadas exatamente ao gosto deles são usadas de forma insistente e repetida
A abordagem via documentação empurra o custo de consciência não para a fase de treinamento, mas para o momento da inferência
- Injeta-se diretamente no contexto o que a ferramenta faz bem, quando e por que usá-la, um guia rápido de início e caminhos para documentação posterior
Mas a solução melhor é criar a própria ferramenta para que ela pareça intuitiva ao agente
Como exemplo de design por Desire Paths, o Beads teve sua CLI evoluindo por 4 meses, com mais de 100 subcomandos, muitos sub-subcomandos, aliases e sintaxes alternativas
- Essa CLI complexa não foi desenhada para humanos, mas para padrões de uso dos agentes
- Observando como os agentes tentavam usá-la, o autor transformou alucinações em funcionalidades reais, e hoje quase todos os palpites deles realmente funcionam
Hallucination Squatting é a técnica de rastrear nomes de domínio que LLMs costumam alucinar, registrá-los e publicar artefatos nesses endereços para que eles sejam de fato baixados
- Isso mostra que até grupos de hackers patrocinados por Estados entendem e exploram o Agent UX
Agent UX é decisivo, mas ainda é ignorado pela maioria das ferramentas
A ferramenta ideal se parece com outras que os agentes já conhecem ou resolve o problema exatamente da forma como o agente quer pensar

Alavanca 6: coeficiente humano (Human Coefficient)

Há softwares que ganham valor pelo simples fato de haver intervenção humana, independentemente da eficiência em tokens
O valor pode vir de curadoria humana, prova social, criatividade, presença física e aprovação
Uma playlist escolhida por humanos pode vencer uma playlist gerada por IA com qualidade equivalente e maior eficiência energética
Em jogos, ambientes com humanos reais tendem a vencer, e é raro alguém querer jogar apenas com IAs claramente superiores a humanos
Redes sociais que excluem agentes podem acabar sendo percebidas como mais atraentes
Mesmo que a IA se torne a melhor professora, algumas pessoas escolherão deliberadamente um professor humano
Mesmo em áreas com alto Human Coefficient, a competição é intensa
- No mundo descrito por Karpathy, agentes podem ser qualquer coisa para qualquer pessoa e têm uma natureza fortemente viciante
Como resultado, é possível que passem a existir muitos softwares extremamente ineficientes, mas com H muito alto

Base para esperança

Softwares que apenas fazem a mediação entre humanos e IA, ou que desempenham o papel de “fingir ser inteligente” que a IA em breve poderá executar diretamente, estão estruturalmente em risco
Ainda assim, a quantidade de software que precisa ser escrita é, na prática, infinita
- Curar todas as doenças, modelar o comportamento de todas as proteínas e explorar todos os cenários de exploração planetária continuam sendo metas em aberto
A ambição humana sempre excede a capacidade cognitiva disponível e, mesmo que o custo dos tokens caia, vamos imediatamente avançar para fronteiras mais distantes
Já temos experiência em resolver problemas de atenção ao longo de várias eras: mídia impressa, internet, redes sociais, publicidade em tempo real e agregadores
O design por Desire Paths realmente funciona, e é possível criar ferramentas que agentes naturalmente queiram usar mesmo sem o enorme orçamento de treinamento de lugares como a OpenAI
O coeficiente humano existe claramente, e as pessoas já começam a sentir fadiga diante de coisas com forte cheiro de agente
- Se o design colocar no centro a conexão e a criatividade humanas, o problema acaba convergindo novamente para o campo tradicional de marketing e branding
Existem vários caminhos de sobrevivência oferecidos pelas seis alavancas
Se você construir algo cuja própria recriação pareça uma loucura, e o tornar fácil de descobrir e fácil de usar, há uma chance bastante sólida de sobrevivência

Sobrevivência do software 3.0 – o que precisa ser construído para sobreviver

Contexto: previsões sobre software na era da IA

Ecossistema de software sob ameaça

Modelo de pressão seletiva (Selection Argument)

Fórmula da taxa de sobrevivência (Survival Ratio)

Alavanca 1: compressão de insight (Insight Compression)

Alavanca 2: eficiência do substrato (Substrate Efficiency)

Alavanca 3: utilidade ampla (Broad Utility)

Alavanca 4: publicidade (Publicity)

Alavanca 5: minimizar fricção (Minimizing Friction)

Alavanca 6: coeficiente humano (Human Coefficient)

Base para esperança

Leituras relacionadas

Ainda não há comentários.