7 pontos por GN⁺ 5 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp
  • A ferramenta de codificação agêntica Claude Code provoca uma mudança maior não em escrever código em si, mas em criar produtos e reorganizar fluxos de trabalho
  • Em uma pesquisa da Microsoft com usuários de IA no trabalho, apareceram ao mesmo tempo pressão para adotar IA rapidamente, criação de novos entregáveis e aumento do tempo dedicado a tarefas de maior valor, mas a recompensa por experimentar IA continuou baixa
  • Quando a organização define como meta o simples volume de uso, surgem rankings de tokens e inflação artificial de uso; métricas ligadas a formas de gerar valor com IA são mais importantes
  • Boris Cherny acredita que o cargo de engenheiro pode mudar para algo mais próximo de builder, com não engenheiros também criando código e engenheiros focando mais em julgamento, planejamento e entendimento do usuário do que em digitar diretamente
  • O aumento de produtividade com IA não leva apenas à redução de horas trabalhadas ou de empregos; empresas passam a reorganizar workflows em torno da IA e indivíduos ganham mais opções e alavancagem

Os dados de trabalho com IA e a armadilha das métricas organizacionais

  • A Microsoft pesquisou 20.000 usuários que usam IA no trabalho real, e apareceu um fenômeno que ela chama de "paradoxo da transformação (transformation paradox)"
    • 65% se preocupam em ficar para trás se não adotarem IA rapidamente
    • 58% estão criando com IA entregáveis que não conseguiriam produzir há um ano
    • 66% responderam que, graças à IA, passaram a dedicar tempo a tarefas de maior valor
    • Em contrapartida, apenas 13% disseram ser recompensados no trabalho por experimentar IA, mostrando um gap entre a disposição de uso e a organização
  • Em outro estudo da Microsoft, quando gestores mostram diretamente como usam IA, o uso aumenta 17% e a confiança nos agentes sobe 30%
    • Mais do que slogans como "a IA é o futuro", o que gera resultado é o gestor mostrar formas concretas como ele realmente usa
    • Se os funcionários acreditarem que podem compartilhar os ganhos de produtividade obtidos com IA, a motivação para usar muda, mas quase não há lugares que façam essa recompensa financeira
  • Alguns locais de trabalho subsidiam o custo de tokens, mas esse apoio nem sempre termina em bons resultados

Token maxing — o efeito colateral das métricas de uso

  • Em grandes empresas de tecnologia, surgiu o fenômeno do token maxing, isto é, consumir tokens em excesso para elevar o volume de uso
    • Segundo funcionários da Amazon ouvidos pelo Financial Times, a Amazon adotou a ferramenta interna mesh claw, inspirada no OpenClaw, e incentivou seu uso
    • Havia um ranking de uso de tokens dentro das equipes, e alguns funcionários rodavam agentes improdutivos sem propósito apenas para inflar o número
    • Na Meta, o maior uso chegou à casa de centenas de bilhões de tokens, e uma quantidade equivalente a milhões de dólares acabou sendo praticamente desperdiçada
  • A posição oficial da Amazon é que o uso de tokens não é métrica de avaliação gerencial, mas os funcionários acreditam que os gestores observam isso e aumentam o uso bruto
    • Na Amazon, existe uma meta vinda de cima para que 80% dos desenvolvedores usem IA toda semana
    • Sem uma recompensa concreta, as pessoas só cumprem o "use IA" e perdem de vista a intenção original de "fazer melhor o trabalho"
    • Para desenvolvedores, mais do que formas vagas de rastreamento, são necessárias métricas produtivas ligadas à criação de valor

O nascimento e a rápida disseminação do Claude Code

  • Claude Code é uma ferramenta de codificação agêntica lançada pela Anthropic em maio do ano anterior, uma ferramenta que recebe palavras e devolve código
    • Em 8 meses após o lançamento, respondeu por cerca de 4% de todo o código enviado ao GitHub
    • Em fevereiro daquele ano, atingiu um run rate anual de receita de US$ 2,5 bilhões, tornando-se o produto corporativo que chegou mais rápido a esse patamar
    • Seu criador, Boris Cherny, formou-se em economia sem ter diploma de ciência da computação, largou a faculdade aos 18 anos, tocou startup, passou por hedge fund e trabalhou 5 anos como principal engineer na Meta antes de entrar no fim de 2024
    • Hoje, Cherny não escreve mais uma linha de código diretamente e, rodando 5 agentes em paralelo em 5 abas de terminal, lida com 20 a 30 pull requests por dia
  • Não começou como uma missão para criar uma ferramenta de codificação, mas como um side project para aprender a API
    • No início, era algo simples que conectava Claude ao AppleScript para mostrar a música que ele estava ouvindo
    • Em dois meses surgiu uma versão do Claude Code, e 20% da equipe de engenharia da Anthropic já usava no primeiro dia
  • Ele entrou em setembro de 2024 e foi para um time labs muito pequeno
    • Esse time criou Claude Code, MCP, skills e o app de desktop, com muitas ideias experimentais cujo sucesso era incerto
    • A Anthropic vinha focando em enterprise, codificação e segurança, e concluiu que, se fosse fazer um produto, um produto de codificação que ajudasse tanto modelos melhores de código quanto pesquisa em segurança fazia sentido
  • Na época, a maioria dos produtos de codificação era extensão de IDE, e no nível do Sonnet 3.5 ficava mais perto de autocomplete avançado
    • Havia uma sensação de model overhang, em que o modelo já conseguia fazer mais, mas não existia um produto que puxasse essa capacidade para fora; e essa sensação continua igual até hoje
    • O produto foi feito em poucos dias, na forma mais barata possível, rodando no terminal sem UI ou app separado
    • A partir das pessoas ao redor, os usuários se espalharam e, em poucas semanas, muita gente dentro da empresa já usava todos os dias; em 5 dias após o lançamento, metade da equipe de engenharia usava
    • Até engenheiros que evitavam terminal passaram a usar, e Cherny, em vez de analisar que "a engenharia de software mudou para sempre", focou apenas em lançar

Os engenheiros vão desaparecer? — a mistura de papéis

  • O primeiro choque foi quando Claude disse qual música estava tocando
    • Ao receber a pergunta, Claude escreveu um código AppleScript para abrir o player de música; Cherny não conhecia aquela linguagem e nem teria pensado em responder daquela forma
    • Resolveu o problema de um jeito que um engenheiro não teria escolhido
  • Os modelos evoluem muito rápido, e ao criar um produto sobre eles é preciso reajustar todo mês
    • Com Co-work, ele reservou 8 voos e 5 hotéis; o único erro foi um hotel de cerca de US$ 5.000 por noite, acima do orçamento, então só esse item foi remarcado
  • Como a tendência é uma curva exponencial, ninguém sabe exatamente o que acontecerá, e duas coisas ocorrem ao mesmo tempo
    • Empresas que, com a produtividade maior dos engenheiros, precisam de menos engenheiros para fazer o mesmo trabalho
    • Empresas que, com maior produtividade por pessoa, criam mais produtos e negócios e acabam precisando de mais engenheiros (o time de Cherny continua limitado pela falta de bons engenheiros e está contratando o mais rápido possível)
  • Os papéis estão se misturando de forma interessante
    • A gestora Fiona não programava havia 15 anos, mas entrou e voltou a programar; a PM Cat e a designer Megan também programam, e o time inteiro escreve código
    • Os não engenheiros escrevem um pouco mais de código, e engenheiros como Cherny passam mais de 6 meses sem escrever diretamente, mas ainda assim constroem coisas o dia inteiro
    • Ainda não está claro se isso deve ser chamado de builder, engenheiro ou product manager, mas o papel em si está claramente mudando

A analogia do trator — o tempo de difusão da tecnologia

  • O trator foi inventado por John Frick em Iowa nos anos 1890, mas só nos anos 1960 os tratores passaram a superar os cavalos em número nos EUA, levando cerca de 70 anos
    • O trator aumentou muito a colheita e a produtividade, mas exigia treinamento para aprender a usar, e no começo era caro, então o cavalo saía mais barato
    • Também faltava desempenho: servia para trigo, mas não para milho, por exemplo, e levou muito tempo para se adaptar a vários tipos de cultivo
    • Na transição atual com IA, os mesmos problemas estão acontecendo em modo speedrun
  • Isso se conecta à visão de IA como tecnologia normal (AI as normal technology) — mesmo com modelos muito capazes, a mudança em pessoas e organizações é lenta
    • Mas, olhando a trajetória de receita da Anthropic, há quem argumente que desta vez a velocidade está sendo maior, então ainda estamos medindo a velocidade real da mudança
  • Computadores aumentam a produtividade, mas isso não significa automaticamente menos horas de trabalho — significa fazer mais coisas no mesmo tempo

A programação foi "resolvida"?

  • A frase "coding is solved" vale apenas para "o tipo de programação que eu faço"
    • Os produtos de Cherny, como cloud CLI, app de desktop e app mobile, têm codebases relativamente novas e simples
    • Já em codebases grandes e complexas de clientes grandes como a NASA, isso ainda não está resolvido, e os modelos também não são perfeitos e cometem erros
  • A objeção dos engenheiros — de que programar não é digitar, mas julgamento, senso e pensamento crítico, áreas em que os agentes são fracos — é válida
    • Mesmo antes, cerca de 50% do dia de Cherny era de digitação real de código; o resto era conversa com usuários, brainstorming, debugging, design e planejamento
    • Quando o modelo assume a codificação, o engenheiro fica livre para fazer as partes mais agradáveis, como falar com usuários e pensar no próximo passo
  • O Claude Code vem sendo escrito há mais de 6 meses 100% com Claude Code, e o mesmo vale para outros produtos como Co-work
    • Em uma conversa recente com a turma do Y Combinator, à afirmação "100% do código foi escrito com Claude Code", metade das centenas de pessoas levantou a mão; para "não escrevo nada com modelo", apenas uma pessoa; o restante estava entre 50% e 100%
    • A visão é que a mudança na engenharia é um indicador antecedente para todas as áreas fora da engenharia
  • Preocupação com atrofia de capacidade e a evolução da programação

    • Surge a preocupação de que, sem escrever código diretamente, a compreensão da própria profissão pode atrofiar
      • Lena, engenheira do time, escreve C++ à mão nos fins de semana por diversão, e esse espaço sempre vai existir
      • Cherny não vê isso como atrofia, mas como continuidade de uma transformação constante da programação
        • Na era soviética existiam cartões perfurados, e na época do programa Apollo também se fazia cálculo manual no papel; aquilo também era "programação"
        • Depois veio a mudança de linguagem de máquina para assembly e então para JavaScript e Python; agora a mudança é para conversar com agentes, e em breve para agentes falando com agentes para programar
      • É como continuar usando calculadora mesmo que parte da habilidade de cálculo mental enfraqueça; a diferença é que, se a ferramenta virar uma superinteligência e enfraquecer silenciosamente o usuário, isso já é outro problema
  • A controvérsia sobre regressão no desempenho dos modelos

    • Após cada novo modelo, aparece periodicamente a reação de que "o desempenho piorou muito"
      • Houve de fato 2 casos causados por bugs, e a Anthropic publicou em blog a causa e a correção
      • No restante dos casos, pode ser mais um fenômeno de fim da lua de mel, em que a pessoa se acostuma com o modelo e perde o espanto inicial
    • Diferentemente de um ano atrás, agora o código do modelo é melhor do que o código que Cherny escreveria diretamente
      • Antes era preciso revisar cada linha três vezes; agora ele delega ao Claude, pede para revisar e testar o resultado, enquanto roda 15 Claudes em paralelo

O paradoxo da produtividade e a ampliação das escolhas

  • Mesmo quando a produtividade sobe, as horas de trabalho não necessariamente diminuem, e isso depende em grande parte da escolha individual e da situação da empresa
  • Isso é explicado pela história da máquina de lavar
    • Antes dela, uma única lavagem levava de 5 a 6 horas e exigia caminhar cerca de 3.000 pés, além de acender fogo, ferver água, esfregar no tanque e torcer, repetindo isso diariamente para cada membro da família
    • A máquina de lavar reduziu em cerca de 3 horas o tempo de cada lavagem
    • Isso foi um dos fatores que permitiram a entrada massiva das mulheres no mercado de trabalho
    • O tempo economizado criou opções individuais: passar tempo com os filhos, caminhar, ler, encontrar amigos ou entrar em trabalhos de fábrica e escritório; a IA amplia escolhas do mesmo jeito
  • Conselho para alguém de 22 anos recém-formado em CS: vagas de nível júnior ainda existem, mas se houver qualquer inclinação empreendedora, a recomendação é abrir uma startup
    • Estamos na melhor era de ouro da história para empreender, e "você e seus agentes" podem construir uma empresa gigantesca
    • Já existem times de 1 a 3 pessoas criando empresas bilionárias e startups excelentes, com uma alavancagem individual enorme
  • Daqui a 3 anos talvez não se use mais o nome "engenheiro", mas a projeção é que haverá 100 vezes mais pessoas escrevendo código ou produzindo código com agentes do que hoje

Claude Co-work — expansão para não engenheiros

  • O Co-work começou ao observar pessoas instalando Claude Code no terminal para fazer declaração de imposto, ou seja, para tarefas que não eram de programação
    • Ele já é usado em contabilidade, finanças e jurídico, além de reservar voos, comprar ingressos de show e até comprar licença de coleta de mariscos no estado de Washington
    • Produtos de codificação nasceram quando engenheiros fizeram algo para si mesmos e isso também serviu para outros; já o Co-work é um novo desafio, feito para não engenheiros em geral
  • A capacidade de executar por longos períodos é a principal direção
    • Há cerca de um ano e meio, por limitação do modelo, o Claude Code saía do caminho depois de apenas 30 segundos, exigindo intervenção
    • Agora, toda noite, centenas ou milhares de agentes rodam por 5, 10 ou 20 horas, e essa já é a forma atual de fazer engenharia
    • O Co-work vai na mesma direção, mas ainda não está claro que tipo de trabalho exige execuções tão longas
  • À medida que memória e entendimento do usuário melhorarem, a evolução vai na direção de antecipar necessidades
    • Exemplo: identificar episódios restantes de podcast e convidados ainda não contatados, fazer brainstorming de candidatos e deixar os e-mails iniciais no rascunho
    • A definição do trabalho pode se dividir entre um modo horizontal, como "todo o design", e um modo vertical, em que uma meta específica é levada até o fim
    • Exemplo vertical: Claude cria a funcionalidade, testa, faz merge e publica
  • Desde o Opus 4.7, Claude ficou mais proativo
    • Depois de lançar uma funcionalidade, ele agenda por conta própria um lembrete para checar feedback dos usuários 12 horas depois e, se houver bug, tenta corrigi-lo — isso elevou a satisfação por antecipar tarefas que humanos tendem a esquecer
  • Claude Mythos não foi aberto ao público externo para a maioria das pessoas, e as informações divulgadas até agora se concentram principalmente em desempenho em código e cibersegurança — é um salto maior do que os avanços habituais, especialmente forte em cyber e coding

De quem é a responsabilidade pela substituição de empregos?

  • Essa transição mistura efeitos bons e ruins, e é impossível prever com precisão quando e em que proporção eles aparecerão
    • A Anthropic ocupa uma posição singular, já que pode se tornar uma fonte de desemprego para engenheiros de software e outras funções
    • Como engenheiros, eles discutem com frequência no time um forte senso de obrigação de avisar sobre a mudança que vem aí e ensinar as pessoas a usar essas ferramentas para levá-las junto nessa transição
  • Isso não é um problema que uma única empresa possa resolver, e nem seria desejável que resolvesse sozinha, porque a solução poderia sair errada
    • É um tema que precisa ser discutido e debatido pela sociedade inteira, e a Anthropic contribui com relatórios econômicos, discussões de política pública e divulgação do que observou
  • Um dos motivos de a Anthropic ser um laboratório de segurança e ao mesmo tempo fazer produtos é permitir que as pessoas experimentem diretamente, entendam e participem da resposta social — se a tecnologia ficar trancada, ninguém consegue formar perspectiva

Power users e a lacuna da IA

  • Há preocupação de que a desigualdade digital vire desigualdade de IA, e os dados até agora mostram que quem melhor aproveita IA tende a já estar nas camadas de renda mais alta
    • A Anthropic tem alguns programas para ampliar o acesso, mas não foram apresentados nomes nem métodos concretos
  • Quem extrai mais valor costuma ser diferente do esperado
    • No hackathon de lançamento do Opus 4.7, os vencedores em geral não eram engenheiros profissionais, mas casos como eletricista, médico e carpinteiro que criaram apps; no hackathon anterior do 4.6, a tendência foi a mesma
    • Os modelos chegaram a um ponto em que até não especialistas conseguem usá-los bem
  • O ponto central para adoção em grandes empresas é mudar o processo de trabalho e colocar Claude no centro
    • Um jeito que funciona bem é dar tokens para todo mundo e permitir experimentação segura, de modo que ideias surjam de pessoas inesperadas
    • As melhores ideias podem vir não do engenheiro sênior, mas do contador no canto ou da pessoa de GTM que montou um dashboard interno
    • Como não há garantia de que quem usa melhor a ferramenta hoje continuará sendo o melhor amanhã, é importante que todos aprendam a usá-la

Perspectivas para o próximo ano

  • No ano que vem haverá muita confusão, e grandes players tentarão se adaptar; muitos vão conseguir
  • Alguns moats tradicionais de negócio vão enfraquecer, enquanto outros permanecem
    • Efeitos de rede — em que o valor cresce com mais usuários — continuam valendo independentemente de IA
    • Economias de escala — redução de custo marginal — também continuam sendo uma vantagem natural
    • Já o custo de troca enfraquece: se Claude puder migrar você do fornecedor A para o B, isso deixa de ser um grande moat
    • Empresas que dependiam de moats em desaparecimento tendem a sofrer, enquanto muitas vão buscar novos moats
  • A inovação será muito maior do que o esperado
    • As novas ideias não vão sair das grandes corporações, mas de pequenas startups de 1, 2 ou 10 pessoas, e a quantidade delas deve explodir
    • Exemplo de startup de descoberta de materiais: pela narrativa histórica, saímos da idade da pedra e do ferro até a era do silício; se encontrarmos novos materiais, podemos entrar na próxima era, e Claude está sendo usado para explorar moléculas e designs possíveis
    • O que antes era difícil até de financiar pode agora virar, nas mãos de equipes pequenas, um avanço que seria impossível 20 anos atrás
    • Quando alguém que domina o domínio passa a ter um "exército de Claudes", consegue fazer muito mais do que conseguiria com um exército humano
  • Cherny automatizou o atendimento a usuários no X e no Threads, mas prefere fazer isso pessoalmente
    • Ele moveu o loop do Claude Code para uma rotina que roda a cada 30 minutos, coletando feedback pelas APIs do Threads e do X
    • Interagir diretamente com usuários é a parte de que ele mais gosta, e até o feedback de "isso não funciona" é fonte de melhoria do produto
    • O Claude Code tem muitos defeitos e ainda está longe do produto ideal, mas ouvir feedback e melhorar um pouco todos os dias é a única forma de construir um bom produto

Ainda não há comentários.

Ainda não há comentários.