- A ferramenta de codificação agêntica Claude Code provoca uma mudança maior não em escrever código em si, mas em criar produtos e reorganizar fluxos de trabalho
- Em uma pesquisa da Microsoft com usuários de IA no trabalho, apareceram ao mesmo tempo pressão para adotar IA rapidamente, criação de novos entregáveis e aumento do tempo dedicado a tarefas de maior valor, mas a recompensa por experimentar IA continuou baixa
- Quando a organização define como meta o simples volume de uso, surgem rankings de tokens e inflação artificial de uso; métricas ligadas a formas de gerar valor com IA são mais importantes
- Boris Cherny acredita que o cargo de engenheiro pode mudar para algo mais próximo de builder, com não engenheiros também criando código e engenheiros focando mais em julgamento, planejamento e entendimento do usuário do que em digitar diretamente
- O aumento de produtividade com IA não leva apenas à redução de horas trabalhadas ou de empregos; empresas passam a reorganizar workflows em torno da IA e indivíduos ganham mais opções e alavancagem
Os dados de trabalho com IA e a armadilha das métricas organizacionais
- A Microsoft pesquisou 20.000 usuários que usam IA no trabalho real, e apareceu um fenômeno que ela chama de "paradoxo da transformação (transformation paradox)"
- 65% se preocupam em ficar para trás se não adotarem IA rapidamente
- 58% estão criando com IA entregáveis que não conseguiriam produzir há um ano
- 66% responderam que, graças à IA, passaram a dedicar tempo a tarefas de maior valor
- Em contrapartida, apenas 13% disseram ser recompensados no trabalho por experimentar IA, mostrando um gap entre a disposição de uso e a organização
- Em outro estudo da Microsoft, quando gestores mostram diretamente como usam IA, o uso aumenta 17% e a confiança nos agentes sobe 30%
- Mais do que slogans como "a IA é o futuro", o que gera resultado é o gestor mostrar formas concretas como ele realmente usa
- Se os funcionários acreditarem que podem compartilhar os ganhos de produtividade obtidos com IA, a motivação para usar muda, mas quase não há lugares que façam essa recompensa financeira
- Alguns locais de trabalho subsidiam o custo de tokens, mas esse apoio nem sempre termina em bons resultados
Token maxing — o efeito colateral das métricas de uso
- Em grandes empresas de tecnologia, surgiu o fenômeno do token maxing, isto é, consumir tokens em excesso para elevar o volume de uso
- Segundo funcionários da Amazon ouvidos pelo Financial Times, a Amazon adotou a ferramenta interna mesh claw, inspirada no OpenClaw, e incentivou seu uso
- Havia um ranking de uso de tokens dentro das equipes, e alguns funcionários rodavam agentes improdutivos sem propósito apenas para inflar o número
- Na Meta, o maior uso chegou à casa de centenas de bilhões de tokens, e uma quantidade equivalente a milhões de dólares acabou sendo praticamente desperdiçada
- A posição oficial da Amazon é que o uso de tokens não é métrica de avaliação gerencial, mas os funcionários acreditam que os gestores observam isso e aumentam o uso bruto
- Na Amazon, existe uma meta vinda de cima para que 80% dos desenvolvedores usem IA toda semana
- Sem uma recompensa concreta, as pessoas só cumprem o "use IA" e perdem de vista a intenção original de "fazer melhor o trabalho"
- Para desenvolvedores, mais do que formas vagas de rastreamento, são necessárias métricas produtivas ligadas à criação de valor
O nascimento e a rápida disseminação do Claude Code
- Claude Code é uma ferramenta de codificação agêntica lançada pela Anthropic em maio do ano anterior, uma ferramenta que recebe palavras e devolve código
- Em 8 meses após o lançamento, respondeu por cerca de 4% de todo o código enviado ao GitHub
- Em fevereiro daquele ano, atingiu um run rate anual de receita de US$ 2,5 bilhões, tornando-se o produto corporativo que chegou mais rápido a esse patamar
- Seu criador, Boris Cherny, formou-se em economia sem ter diploma de ciência da computação, largou a faculdade aos 18 anos, tocou startup, passou por hedge fund e trabalhou 5 anos como principal engineer na Meta antes de entrar no fim de 2024
- Hoje, Cherny não escreve mais uma linha de código diretamente e, rodando 5 agentes em paralelo em 5 abas de terminal, lida com 20 a 30 pull requests por dia
- Não começou como uma missão para criar uma ferramenta de codificação, mas como um side project para aprender a API
- No início, era algo simples que conectava Claude ao AppleScript para mostrar a música que ele estava ouvindo
- Em dois meses surgiu uma versão do Claude Code, e 20% da equipe de engenharia da Anthropic já usava no primeiro dia
- Ele entrou em setembro de 2024 e foi para um time labs muito pequeno
- Esse time criou Claude Code, MCP, skills e o app de desktop, com muitas ideias experimentais cujo sucesso era incerto
- A Anthropic vinha focando em enterprise, codificação e segurança, e concluiu que, se fosse fazer um produto, um produto de codificação que ajudasse tanto modelos melhores de código quanto pesquisa em segurança fazia sentido
- Na época, a maioria dos produtos de codificação era extensão de IDE, e no nível do Sonnet 3.5 ficava mais perto de autocomplete avançado
- Havia uma sensação de model overhang, em que o modelo já conseguia fazer mais, mas não existia um produto que puxasse essa capacidade para fora; e essa sensação continua igual até hoje
- O produto foi feito em poucos dias, na forma mais barata possível, rodando no terminal sem UI ou app separado
- A partir das pessoas ao redor, os usuários se espalharam e, em poucas semanas, muita gente dentro da empresa já usava todos os dias; em 5 dias após o lançamento, metade da equipe de engenharia usava
- Até engenheiros que evitavam terminal passaram a usar, e Cherny, em vez de analisar que "a engenharia de software mudou para sempre", focou apenas em lançar
Os engenheiros vão desaparecer? — a mistura de papéis
- O primeiro choque foi quando Claude disse qual música estava tocando
- Ao receber a pergunta, Claude escreveu um código AppleScript para abrir o player de música; Cherny não conhecia aquela linguagem e nem teria pensado em responder daquela forma
- Resolveu o problema de um jeito que um engenheiro não teria escolhido
- Os modelos evoluem muito rápido, e ao criar um produto sobre eles é preciso reajustar todo mês
- Com Co-work, ele reservou 8 voos e 5 hotéis; o único erro foi um hotel de cerca de US$ 5.000 por noite, acima do orçamento, então só esse item foi remarcado
- Como a tendência é uma curva exponencial, ninguém sabe exatamente o que acontecerá, e duas coisas ocorrem ao mesmo tempo
- Empresas que, com a produtividade maior dos engenheiros, precisam de menos engenheiros para fazer o mesmo trabalho
- Empresas que, com maior produtividade por pessoa, criam mais produtos e negócios e acabam precisando de mais engenheiros (o time de Cherny continua limitado pela falta de bons engenheiros e está contratando o mais rápido possível)
- Os papéis estão se misturando de forma interessante
- A gestora Fiona não programava havia 15 anos, mas entrou e voltou a programar; a PM Cat e a designer Megan também programam, e o time inteiro escreve código
- Os não engenheiros escrevem um pouco mais de código, e engenheiros como Cherny passam mais de 6 meses sem escrever diretamente, mas ainda assim constroem coisas o dia inteiro
- Ainda não está claro se isso deve ser chamado de builder, engenheiro ou product manager, mas o papel em si está claramente mudando
A analogia do trator — o tempo de difusão da tecnologia
- O trator foi inventado por John Frick em Iowa nos anos 1890, mas só nos anos 1960 os tratores passaram a superar os cavalos em número nos EUA, levando cerca de 70 anos
- O trator aumentou muito a colheita e a produtividade, mas exigia treinamento para aprender a usar, e no começo era caro, então o cavalo saía mais barato
- Também faltava desempenho: servia para trigo, mas não para milho, por exemplo, e levou muito tempo para se adaptar a vários tipos de cultivo
- Na transição atual com IA, os mesmos problemas estão acontecendo em modo speedrun
- Isso se conecta à visão de IA como tecnologia normal (AI as normal technology) — mesmo com modelos muito capazes, a mudança em pessoas e organizações é lenta
- Mas, olhando a trajetória de receita da Anthropic, há quem argumente que desta vez a velocidade está sendo maior, então ainda estamos medindo a velocidade real da mudança
- Computadores aumentam a produtividade, mas isso não significa automaticamente menos horas de trabalho — significa fazer mais coisas no mesmo tempo
A programação foi "resolvida"?
- A frase "coding is solved" vale apenas para "o tipo de programação que eu faço"
- Os produtos de Cherny, como cloud CLI, app de desktop e app mobile, têm codebases relativamente novas e simples
- Já em codebases grandes e complexas de clientes grandes como a NASA, isso ainda não está resolvido, e os modelos também não são perfeitos e cometem erros
- A objeção dos engenheiros — de que programar não é digitar, mas julgamento, senso e pensamento crítico, áreas em que os agentes são fracos — é válida
- Mesmo antes, cerca de 50% do dia de Cherny era de digitação real de código; o resto era conversa com usuários, brainstorming, debugging, design e planejamento
- Quando o modelo assume a codificação, o engenheiro fica livre para fazer as partes mais agradáveis, como falar com usuários e pensar no próximo passo
- O Claude Code vem sendo escrito há mais de 6 meses 100% com Claude Code, e o mesmo vale para outros produtos como Co-work
- Em uma conversa recente com a turma do Y Combinator, à afirmação "100% do código foi escrito com Claude Code", metade das centenas de pessoas levantou a mão; para "não escrevo nada com modelo", apenas uma pessoa; o restante estava entre 50% e 100%
- A visão é que a mudança na engenharia é um indicador antecedente para todas as áreas fora da engenharia
-
Preocupação com atrofia de capacidade e a evolução da programação
- Surge a preocupação de que, sem escrever código diretamente, a compreensão da própria profissão pode atrofiar
- Lena, engenheira do time, escreve C++ à mão nos fins de semana por diversão, e esse espaço sempre vai existir
- Cherny não vê isso como atrofia, mas como continuidade de uma transformação constante da programação
- Na era soviética existiam cartões perfurados, e na época do programa Apollo também se fazia cálculo manual no papel; aquilo também era "programação"
- Depois veio a mudança de linguagem de máquina para assembly e então para JavaScript e Python; agora a mudança é para conversar com agentes, e em breve para agentes falando com agentes para programar
- É como continuar usando calculadora mesmo que parte da habilidade de cálculo mental enfraqueça; a diferença é que, se a ferramenta virar uma superinteligência e enfraquecer silenciosamente o usuário, isso já é outro problema
- Surge a preocupação de que, sem escrever código diretamente, a compreensão da própria profissão pode atrofiar
-
A controvérsia sobre regressão no desempenho dos modelos
- Após cada novo modelo, aparece periodicamente a reação de que "o desempenho piorou muito"
- Houve de fato 2 casos causados por bugs, e a Anthropic publicou em blog a causa e a correção
- No restante dos casos, pode ser mais um fenômeno de fim da lua de mel, em que a pessoa se acostuma com o modelo e perde o espanto inicial
- Diferentemente de um ano atrás, agora o código do modelo é melhor do que o código que Cherny escreveria diretamente
- Antes era preciso revisar cada linha três vezes; agora ele delega ao Claude, pede para revisar e testar o resultado, enquanto roda 15 Claudes em paralelo
- Após cada novo modelo, aparece periodicamente a reação de que "o desempenho piorou muito"
O paradoxo da produtividade e a ampliação das escolhas
- Mesmo quando a produtividade sobe, as horas de trabalho não necessariamente diminuem, e isso depende em grande parte da escolha individual e da situação da empresa
- Isso é explicado pela história da máquina de lavar
- Antes dela, uma única lavagem levava de 5 a 6 horas e exigia caminhar cerca de 3.000 pés, além de acender fogo, ferver água, esfregar no tanque e torcer, repetindo isso diariamente para cada membro da família
- A máquina de lavar reduziu em cerca de 3 horas o tempo de cada lavagem
- Isso foi um dos fatores que permitiram a entrada massiva das mulheres no mercado de trabalho
- O tempo economizado criou opções individuais: passar tempo com os filhos, caminhar, ler, encontrar amigos ou entrar em trabalhos de fábrica e escritório; a IA amplia escolhas do mesmo jeito
- Conselho para alguém de 22 anos recém-formado em CS: vagas de nível júnior ainda existem, mas se houver qualquer inclinação empreendedora, a recomendação é abrir uma startup
- Estamos na melhor era de ouro da história para empreender, e "você e seus agentes" podem construir uma empresa gigantesca
- Já existem times de 1 a 3 pessoas criando empresas bilionárias e startups excelentes, com uma alavancagem individual enorme
- Daqui a 3 anos talvez não se use mais o nome "engenheiro", mas a projeção é que haverá 100 vezes mais pessoas escrevendo código ou produzindo código com agentes do que hoje
Claude Co-work — expansão para não engenheiros
- O Co-work começou ao observar pessoas instalando Claude Code no terminal para fazer declaração de imposto, ou seja, para tarefas que não eram de programação
- Ele já é usado em contabilidade, finanças e jurídico, além de reservar voos, comprar ingressos de show e até comprar licença de coleta de mariscos no estado de Washington
- Produtos de codificação nasceram quando engenheiros fizeram algo para si mesmos e isso também serviu para outros; já o Co-work é um novo desafio, feito para não engenheiros em geral
- A capacidade de executar por longos períodos é a principal direção
- Há cerca de um ano e meio, por limitação do modelo, o Claude Code saía do caminho depois de apenas 30 segundos, exigindo intervenção
- Agora, toda noite, centenas ou milhares de agentes rodam por 5, 10 ou 20 horas, e essa já é a forma atual de fazer engenharia
- O Co-work vai na mesma direção, mas ainda não está claro que tipo de trabalho exige execuções tão longas
- À medida que memória e entendimento do usuário melhorarem, a evolução vai na direção de antecipar necessidades
- Exemplo: identificar episódios restantes de podcast e convidados ainda não contatados, fazer brainstorming de candidatos e deixar os e-mails iniciais no rascunho
- A definição do trabalho pode se dividir entre um modo horizontal, como "todo o design", e um modo vertical, em que uma meta específica é levada até o fim
- Exemplo vertical: Claude cria a funcionalidade, testa, faz merge e publica
- Desde o Opus 4.7, Claude ficou mais proativo
- Depois de lançar uma funcionalidade, ele agenda por conta própria um lembrete para checar feedback dos usuários 12 horas depois e, se houver bug, tenta corrigi-lo — isso elevou a satisfação por antecipar tarefas que humanos tendem a esquecer
- Claude Mythos não foi aberto ao público externo para a maioria das pessoas, e as informações divulgadas até agora se concentram principalmente em desempenho em código e cibersegurança — é um salto maior do que os avanços habituais, especialmente forte em cyber e coding
De quem é a responsabilidade pela substituição de empregos?
- Essa transição mistura efeitos bons e ruins, e é impossível prever com precisão quando e em que proporção eles aparecerão
- A Anthropic ocupa uma posição singular, já que pode se tornar uma fonte de desemprego para engenheiros de software e outras funções
- Como engenheiros, eles discutem com frequência no time um forte senso de obrigação de avisar sobre a mudança que vem aí e ensinar as pessoas a usar essas ferramentas para levá-las junto nessa transição
- Isso não é um problema que uma única empresa possa resolver, e nem seria desejável que resolvesse sozinha, porque a solução poderia sair errada
- É um tema que precisa ser discutido e debatido pela sociedade inteira, e a Anthropic contribui com relatórios econômicos, discussões de política pública e divulgação do que observou
- Um dos motivos de a Anthropic ser um laboratório de segurança e ao mesmo tempo fazer produtos é permitir que as pessoas experimentem diretamente, entendam e participem da resposta social — se a tecnologia ficar trancada, ninguém consegue formar perspectiva
Power users e a lacuna da IA
- Há preocupação de que a desigualdade digital vire desigualdade de IA, e os dados até agora mostram que quem melhor aproveita IA tende a já estar nas camadas de renda mais alta
- A Anthropic tem alguns programas para ampliar o acesso, mas não foram apresentados nomes nem métodos concretos
- Quem extrai mais valor costuma ser diferente do esperado
- No hackathon de lançamento do Opus 4.7, os vencedores em geral não eram engenheiros profissionais, mas casos como eletricista, médico e carpinteiro que criaram apps; no hackathon anterior do 4.6, a tendência foi a mesma
- Os modelos chegaram a um ponto em que até não especialistas conseguem usá-los bem
- O ponto central para adoção em grandes empresas é mudar o processo de trabalho e colocar Claude no centro
- Um jeito que funciona bem é dar tokens para todo mundo e permitir experimentação segura, de modo que ideias surjam de pessoas inesperadas
- As melhores ideias podem vir não do engenheiro sênior, mas do contador no canto ou da pessoa de GTM que montou um dashboard interno
- Como não há garantia de que quem usa melhor a ferramenta hoje continuará sendo o melhor amanhã, é importante que todos aprendam a usá-la
Perspectivas para o próximo ano
- No ano que vem haverá muita confusão, e grandes players tentarão se adaptar; muitos vão conseguir
- Alguns moats tradicionais de negócio vão enfraquecer, enquanto outros permanecem
- Efeitos de rede — em que o valor cresce com mais usuários — continuam valendo independentemente de IA
- Economias de escala — redução de custo marginal — também continuam sendo uma vantagem natural
- Já o custo de troca enfraquece: se Claude puder migrar você do fornecedor A para o B, isso deixa de ser um grande moat
- Empresas que dependiam de moats em desaparecimento tendem a sofrer, enquanto muitas vão buscar novos moats
- A inovação será muito maior do que o esperado
- As novas ideias não vão sair das grandes corporações, mas de pequenas startups de 1, 2 ou 10 pessoas, e a quantidade delas deve explodir
- Exemplo de startup de descoberta de materiais: pela narrativa histórica, saímos da idade da pedra e do ferro até a era do silício; se encontrarmos novos materiais, podemos entrar na próxima era, e Claude está sendo usado para explorar moléculas e designs possíveis
- O que antes era difícil até de financiar pode agora virar, nas mãos de equipes pequenas, um avanço que seria impossível 20 anos atrás
- Quando alguém que domina o domínio passa a ter um "exército de Claudes", consegue fazer muito mais do que conseguiria com um exército humano
- Cherny automatizou o atendimento a usuários no X e no Threads, mas prefere fazer isso pessoalmente
- Ele moveu o loop do Claude Code para uma rotina que roda a cada 30 minutos, coletando feedback pelas APIs do Threads e do X
- Interagir diretamente com usuários é a parte de que ele mais gosta, e até o feedback de "isso não funciona" é fonte de melhoria do produto
- O Claude Code tem muitos defeitos e ainda está longe do produto ideal, mas ouvir feedback e melhorar um pouco todos os dias é a única forma de construir um bom produto
Ainda não há comentários.