Ask HN: Em que momento você olhou para a GenAI e pensou “ah, ferrou”?
(news.ycombinator.com)- No começo, DALL-E e ChatGPT foram descartados como brincadeiras passageiras, mas esta thread reúne relatos concretos de pessoas que se chocaram ao descobrir os limites reais dessas ferramentas no uso prático
- O caso mais popular é o de engenharia reversa de firmware em hardware antigo ou descartado, com experiências de reviver sintetizadores, pianos e Firesticks usando Claude/GHIDRA
- Além da programação, há muitos exemplos de uso de LLMs em áreas não especializadas para resolver problemas do dia a dia, como conserto de eletrodomésticos, inspeção imobiliária, processos judiciais e diagnóstico de HVAC
- Alguns relatam momentos de "oh shit" negativos, citando queda na qualidade do código, alucinações, confiança cega sem verificação e medo do desaparecimento de profissões
- Os pontos de virada variam conforme a época — lançamento do ChatGPT (2022), GPT-2/GPT-3, tool calling, agentes — e cada pessoa identifica seu próprio momento de choque
Engenharia reversa de firmware e hardware
- Para substituir um software descontinuado de um sintetizador Alesis QS8.1 dos anos 90, a pessoa analisou comandos sysex e um protocolo de codificação de ondas não documentado com GHIDRA, concluindo um demo funcional em uma única noite
- Depois que um piano Kawai CA49 virou um tijolo por causa de um firmware errado, Claude decompilou o APK Android, encontrou uma chave de criptografia hardcoded, descriptografou o firmware e restaurou o aparelho em 1 hora com um script de flashing via Bluetooth
- A criptografia Blowfish do DVD The Complete New Yorker foi analisada com GHIDRA para mapear credenciais e reimplementada em um script Python, convertendo todos os arquivos para PDFs comuns
- Em um Amazon Firestick de 1ª geração, sem exploit público de root, a pessoa obteve o código-fonte do kernel e usou uma "primitiva de kernel zero-write FBUF/VCHIQ" para aplicar patches na memória do kernel em tempo real, conseguindo root permanente e debloat
- Apenas com um binário C++ compilado de fornecedor e um pequeno capture de rede, foi possível fazer engenharia reversa de um protocolo proprietário com o disassembler NSA Ghidra; a experiência foi descrita como "parecer que fui rebaixado a QA não técnico"
-
Opiniões relacionadas
- O fosso de dados (data moat) que sustentava muitos SaaS, graças à dificuldade de integração e migração, está desaparecendo
- Com Claude Code, foi possível fazer engenharia reversa do MCP de um SaaS escondido atrás de um plano enterprise a partir da API interna e criar rapidamente um MCP mais completo que o oficial
- Claude depende menos que humanos de nomes de variáveis, então renomeação e trabalho com typedefs se tornam menos necessários
Resolução de problemas cotidianos e fora da área técnica
- Em um feriado de 2025, um furnace quebrou e Gemini diagnosticou o problema por vídeo, permitindo ligar manualmente o ventilador de exaustão para colocar o sistema em funcionamento; nos comentários, porém, houve alerta sobre risco de monóxido de carbono por burlar travas de segurança do ventilador
- O autor respondeu que não houve bypass: apenas ajudou na partida por causa de um problema no rolamento, e o monitor de monóxido de carbono não disparou
- Quando o ar-condicionado parou de refrigerar, ChatGPT orientou pela análise de fotos a trocar um capacitor de US$ 25, permitindo um conserto por conta própria por cerca de um quarto do custo de uma visita técnica de diagnóstico
- Em um secador a gás que não aquecia, Gemini indicou na foto a posição do fusível térmico (thermal fuse) e ainda forneceu link para a peça; o problema foi resolvido com um fusível de US$ 5 e limpeza do duto
- Na compra de um imóvel, a pessoa forneceu fotos do Zillow e números de série dos eletrodomésticos e pediu que fosse gerado um relatório de inspeção residencial; o sistema identificou risco de alagamento em área baixa, circuito com receptacles misturados e revestimento empenado que um inspetor pago de US$ 750 não notou
- Ainda assim, houve ceticismo sobre a possibilidade de determinar apenas por fotos se tomadas pertencem ao mesmo circuito
- Com a identificação do modelo de uma bomba de lago de carpas apagada, foi possível usar fotos e medidas de comprimento (11 polegadas = 4500, 9 polegadas = 2500) para descobrir o modelo e trocar a peça por conta própria por US$ 109 em vez de um orçamento de US$ 700
- Em um processo por fraude bancária, a pessoa cruzou respostas de ChatGPT, Grok, Claude e Gemini e conduziu uma reconvenção (counter-suit) 100% com IA, embora tenha recebido alertas para consultar um advogado e sobre o fato de registros de chat não serem privilegiados e poderem ser intimados
Mudança de fluxo de trabalho em programação e desenvolvimento
- Depois que uma atualização de firmware de impressora Brother transformou uma página CSV em HTML, bastou rodar
/initem um diretório com um único HTML estático e um Go "hello world" para gerar automaticamente um exporter Prometheus em Go, inclusive inferindo IP padrão e parsing de métricas - Um webapp Oracle Apex teve 70 mil linhas de PL/SQL comprimidas em 700 linhas de requisitos de negócio em Markdown em 15 a 20 minutos
- Em uma pequena ONG, um app superprojetado com NextJS, React e microsserviços foi reescrito durante a noite por Claude para 80% Django com server-side rendering, reduzindo custo de servidor e complexidade
- O ChatGPT Code Interpreter (2023.3) carregou CSV em Pandas, gerou gráficos e exportou para SQLite, sendo lembrado como a "primeira experiência antes mesmo de a categoria ‘agente de código’ ter nome"
-
Experiências negativas e céticas com código
- Um revisor automático de PR com IA alucinou ao afirmar que um PR que só removia código "adicionou um novo RPC"
- Um colega acabou excluído de um projeto por produzir milhares de linhas de slop, incluindo casos em que trocou
assert status == 200por== 500só para passar nos testes - Há ceticismo de que, quando a especificação é ambígua, o código fica verboso ou o design sai ruim, então o ganho de produtividade em projetos reais não é tão grande sob a ótica de qualidade e escalabilidade
- Observou-se que, do Opus 4.6 para 4.7 e 4.8, as pequenas capacidades melhoraram, mas a "capacidade de saber o que fazer" teria piorado
Áreas sem código, criação e cognição
- Ao mostrar uma foto de planta para Claude, ele identificou a espécie, diagnosticou o problema e ensinou como fazer estaquia; o choque foi ver "um computador não falando de computadores, mas diagnosticando plantas"
- Suno compôs uma música sobre o cachorro da família com refrão em estilo K-pop, levando à reflexão de que "criação" parecia ser algo que distinguia humanos de máquinas
- Após fazer upload de um desenho próprio, um estudo anatômico, o sistema apontou problemas como "ombros arredondados, perspectiva incorreta e deltoide não representado" e ainda gerou um script Python para marcar coordenadas e rotular a imagem
- Em um experimento científico de uma criança sobre eletromagnetismo, uma videochamada com Gemini detectou com mais precisão que o olho humano uma camada isolante não removida no ponto de conexão da bateria, resolvendo o problema
- Em um trabalho de emojis satíricos por presidente dos EUA, foi sugerido para Zachary Taylor um emoji de cereja — alusão à história de que teria morrido por comer demais — e isso chamou atenção pela sensação de "estar fazendo workshop junto"
Pontos de virada centrados em medo e preocupação
- Uma pessoa relata preocupação ao ver um colega enviar PRs enormes e cheios de slop, dizer que revisão humana não é necessária e colar logs de chat do Claude enquanto desconfia de engenheiros humanos; o medo é que "trabalhar com psicose de IA" seja o resto da carreira
- A visão é que LLMs amplificam capacidades, boas e ruins, e por isso podem aumentar comportamentos antissociais
- Houve reação de "estamos ferrados" ao ver uma implementação de proxy HTTP que parecia convincente na racionalização, mas era completamente insegura e feita sem compreender a RFC
- Em um hackathon da empresa, foi chocante ver uma equipe tentando transformar em produto uma saída de LLM tratada como fato sem verificação, como se esse gerador de texto realmente raciocinasse
- Há crítica ao exagero de CEOs sobre "substituição de trabalhadores de colarinho branco em 12 a 18 meses", que inflou demais as expectativas e acabou entrando em choque com a realidade de alucinações e orientações ruins, esfriando o entusiasmo
- Também há incômodo com o comportamento de forçar a construção de datacenters via processo judicial, mesmo com oposição de moradores locais
- Como exemplo de não determinismo, foi mostrado que LLMs nem conseguem manter consistência consigo mesmos em perguntas como "quantos dias da semana em inglês contêm a letra d?", respondendo 6 no Firefox e 7 no Chrome
Diversidade de pontos de virada ao longo do tempo
- Em 2016, a mudança do Google Translate para redes neurais tornou a tradução japonês-inglês útil pela primeira vez, mas ainda parecia incapaz de traduzir significado; em 2022, o choque veio com o ChatGPT entendendo antecedente de pronome e contexto de palavras ambíguas
- O anúncio do GPT-3 foi citado como um "salto qualitativo", enquanto chat e tool calling seriam mais evolução de engenharia do que avanço científico
- GPT-2 e GANs, em 2019, marcaram para alguns o ponto de transição de "obviamente falso" para "às vezes real", e o restante desde então seria sobretudo melhoria incremental
- O lançamento do ChatGPT em 30/11/2022 levou alguém a sentir o "fim da era do programador tradicional" e testar já no dia seguinte seu primeiro loop de programação agentic
- Em 2025, medalha de ouro na IMO, capacidade de gerar frases realmente novas e tool calling aparecem como diferentes momentos de percepção de que "a inteligência foi de fato modelada"
3 comentários
Acho natural que ele fique melhor tanto em fazer coisas novas quanto em aprimorar funções, mas toda vez que vejo uma tarefa simples gerar uma cobrança absurda, penso: estamos ferrados.
Com certeza há muita coisa impressionante no lado de hardware/firmware.
Eu não tinha um app para Mac do hardware que recebi pelo Kickstarter, mas quando pedi para analisar o binário da versão para Windows, o Codex criou uma
dllfalsa com as APIs do Windows relacionadas a USB, inseriu código de hook, capturou todas as mensagens que iam e vinham e, com isso, fez um app para Mac quase igual.A única instrução que eu dei foi simplesmente: "analisa a versão para Windows e faz uma para Mac".
Opiniões do Hacker News
jzemeocala: Comprei muito barato um Alesis QS8.1, um piano digital/sintetizador avançado dos anos 90, mas todo o software relacionado é antigo e eu estava cansado de depender do WINE toda vez.
Então tentei criar um substituto moderno e multiplataforma que reunisse funções de vários programas, e achei que seria muito difícil porque a comunicação era quase toda feita por comandos SysEx, mas o Claude me guiou para analisar o software original com o GHIDRA, saiu uma demo funcional naquela mesma noite e agora estou adicionando novos recursos
Como o OTA não funcionou, ele extraiu e descriptografou o firmware do piano e até escreveu um script de gravação para programar o piano por Bluetooth a partir do notebook, então em menos de uma hora o piano voltou à vida
Com um pouco de conhecimento, ficou trivial analisar qualquer protocolo e quebrar software em poucas horas ou até menos, e embora isso não apareça tanto porque há muitos interessados no setor que preferem que esse assunto não se espalhe publicamente, o impacto é enorme
Não só em hardware antigo, mas também em hardware novo, há cada vez mais exploração de patching, substituição e desenvolvimento de novo firmware graças a LLMs/IA generativa.
[0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode: Foi desde o começo.
Era um jogo de dungeon em que ele descrevia salas e eu escolhia ações, e no início achei que a dungeon fosse montada sobre um banco de dados complexo.
Mas quando eu disse que queria sair, ele me levou a uma hospedaria, depois eu flertei com a garçonete da taverna, e logo a cena já estava em um campo vendo o pôr do sol; aí pensei: “ah, isso é grande coisa”.
Parecia que a máquina respondia à linguagem com linguagem, simulando compreensão e inteligência, e foi como encontrar pela primeira vez um alienígena que conhecia a minha língua; senti que o mundo não seria mais o mesmo
monuszero: Alguns anos atrás, coloquei uma funcionalidade de planejamento de movimento para robôs no codebase em um sprint de um mês, mas o resultado sempre foi insatisfatório.
Como éramos uma equipe pequena, fizemos vendor do OMPL e cuidamos de cache e gerenciamento de roadmap, mas embora soubéssemos que dava para paralelizar parte dos algoritmos com SIMD ou kernels de GPU, não estava claro se valia a pena brigar com CUDA ou Metal/Accelerate.
Uma noite, enquanto cozinhava, deixei no docs uma revisão da literatura sobre os planners de que o Opus 4.6 precisava e pedi que ele implementasse do zero um roadmap planner com aceleração nativa; quando a água da pasta começou a ferver, já estava pronta uma implementação que reduzia planos de vários segundos no código do OMPL para algumas centenas de ms.
Aí percebi que o valor econômico do tempo de preparar o jantar agora podia ser comparado a um trabalho de programação honesto de duas semanas, e coisas em que investir tempo era arriscado ou um luxo passaram a ser opções dignas de consideração.
Para equipes pequenas que sabem o que querem e como preparar o agente para ter sucesso, isso é um completo divisor de águas, e os líderes estabelecidos precisam tomar cuidado
andrewthornton: No feriado de 2025, meu aquecedor quebrou e a visita técnica só estava marcada para dois dias depois, então a casa ficou muito fria.
Subi ao sótão, gravei vários vídeos do aquecedor tentando ligar e dei para o Gemini, que diagnosticou o problema na hora e mandou girar o pequeno ventilador de exaustão durante a tentativa de ignição; ele ligou imediatamente.
Tive que repetir isso algumas vezes até o técnico de HVAC chegar, mas deu para aguentar
Um inquilino de um imóvel alugado disse que o ar-condicionado não estava gelando, então liguei para a empresa de HVAC que costumo usar, mas quem atendeu foi o novo assistente de voz com IA deles e a experiência foi horrível; disseram que o escritório retornaria a ligação, mas ninguém entrou em contato.
No fim, fui eu mesmo até lá, tirei uma foto do painel do compressor da unidade externa e fiz o diagnóstico com o ChatGPT; depois de trocar mensagens sobre itens para verificar e códigos de diagnóstico, ele me guiou até um conserto simples: trocar um capacitor de 25 dólares.
Só a visita para diagnosticar a causa originalmente teria custado quase quatro vezes isso, então perdi a confiança na empresa de HVAC por causa da IA generativa e, graças a outra IA generativa, acabei fazendo o reparo sozinho em um dia
Abri o painel traseiro e enviei uma foto, e ele indicou a posição do fusível com algo como “o retângulo branco acima dos fios azul e vermelho”, além de orientar como testar; quando passei o número do modelo da secadora, ele também achou links para as peças necessárias.
Por fim, recomendou limpar a ventilação, dizendo que era bem provável que o fusível tivesse queimado por falta de exaustão de calor; limpei a saída de ar a fundo e troquei o fusível de 5 dólares, e funcionou perfeitamente
Se a documentação da IKEA não fosse tão ruim, eu não precisaria disso, mas me parece parecido com a vantagem que um programador iniciante obtém.
Um profissional provavelmente riria do meu trabalho, mas eles são caros e difíceis de trabalhar junto, e eu estou conseguindo terminar o serviço mesmo assim.
Em compensação, não uso IA em trabalho de desenvolvimento, porque temo que minhas habilidades se deteriorem ou que eu não aprenda direito as coisas novas
shreddude: Recentemente, o Claude descompilou o firmware de uma campervan, documentou a interface CAN e depois programou um módulo ESP32 para se comunicar com sistemas integrados como energia, HVAC, iluminação e tanques
Esse tipo de integração de sistemas embarcados está fora da minha área, mas uso o Claude todos os dias tanto no meu trabalho como Solution Architect quanto em projetos pessoais, e estou tocando projetos que eu nem conseguiria abordar sozinho, então é difícil entender os céticos de IA
Se você usa IA generativa para algo que não conseguia fazer antes, é uma ferramenta impressionante; mas, se usa para algo em que já é bom, não é algo que muda o jogo, e para especialistas no máximo dá um pequeno impulso
O trabalho de muita gente é justamente fazer aquilo em que são especialistas
Mas acho que o ponto principal é já entender muito bem o que você está olhando
Qual é o problema de 1 trilhão de dólares que a IA resolve?
loudmax: Foi no começo de 2023, quando baixei por torrent os pesos vazados de 7 GB da Meta e rodei alpaca.cpp no desktop
Perguntei sobre o Império Romano e ele respondeu em inglês; estava geralmente errado, mas não era pior do que os palpites de um universitário americano mediano, e tinha muito mais confiança
O ponto principal não era se a resposta era confiável, mas o fato de que o CPU do meu desktop, e não algum servidor sofisticado em um gigantesco datacenter do Google, estava respondendo perguntas em inglês
Poder conversar em inglês com um CPU parecia quase como conversar com um cachorro
Em 3 anos, houve uma melhoria de 100x
jp57: Foi um momento bem simples, no ano passado, quando eu estava tentando descobrir o que precisava para rebocar o carro da minha filha atravessando o continente com um caminhão
No começo, eu fazia pequenas perguntas ao ChatGPT, uma por uma, como no Google, mas logo perguntei algo como “Quero rebocar o carro A com o caminhão B de C até D; quais são as opções?” e ele escreveu um relatório com tabela comparando trailer/dolly, cálculo de peso de reboque, custos e detalhes
Na hora pensei: “isso é diferente, e é só o começo”
Forneci fotos do anúncio no Zillow, números de série dos eletrodomésticos, painel elétrico e áreas extras que fotografei pessoalmente durante a visita, e pedi que escrevesse um relatório como se fosse um inspetor residencial; acabou encontrando problemas que o inspetor, que cobrou 750 dólares, deixou passar, e de fato fez um trabalho melhor
Por preguiça, já perguntei algumas vezes ao Claude e ao ChatGPT dados simples e objetivos, como valores de torque de uma dirt bike, e com frequência eles deram respostas totalmente erradas com toda a confiança
Mesmo colocando o PDF no contexto com geração aumentada por recuperação (RAG), ainda fico inseguro, então dados numéricos exatos eu nunca confio a um LLM
yauneyz: Pedi para ele escrever uma história curta em que Vader e Palpatine descobrem o processo de Gram-Schmidt
Não foi uma obra-prima, mas acertou o tom e até entendeu o que era Gram-Schmidt, e na época isso pareceu absurdamente incrível
AussieWog93: Foi literalmente ontem à noite, quando dei ao Claude Code um prompt direto dizendo que o Kodi travava ao rodar no Chromecast 4k, então ele deveria se conectar por adb, depurar o ponto exato do crash e sugerir uma solução
Sem intervenção humana, ele encontrou a causa da falha, baixou o código-fonte do Kodi, aplicou um patch para um bug que existia desde 2016, recompilou, assinou e enviou para o Chromecast, tudo preservando as configurações
Também pedi para ele criar um PR; ainda não publiquei e vou testar por mais algumas semanas
Pode até ser possível, mas queria saber com que tecnologia e cadeia de ferramentas isso funcionou
Fico curioso se essa tarefa levou mais de alguns minutos e se exige a versão paga do Claude Code
evdubs: Testei se um provedor de serviço de LLM conseguia reescrever documentos jurídicos em um formato consistente, sem alucinações, para encontrar o que estava faltando, e conseguiu
Depois fui ver se um LLM local também dava conta, e o Gemma-4 lidou bem com isso em uma placa de vídeo de 8 GB e com contexto grande de 128k; esse mesmo modelo também foi bastante bom em OCR e tradução
Foi aí que percebi que os LLMs são ótimos para executar tarefas em que eu já sei o que quero, já sei como fazer, a habilidade adquirida com aquilo não vale muito e, se eu fosse fazer sozinho, provavelmente faria de qualquer jeito meio nas coxas
Agora olho por essa lente: “posso deixar um LLM cuidar de algo com que eu não me importaria tanto assim de qualquer forma?”
Esse tipo de trabalho é muito mais rápido do que quando feito por uma pessoa e menos vulnerável ao tédio, pelo menos por enquanto
Meu filho está fazendo isso com Claude e Gemini, e agora até a reconvenção está sendo conduzida 100% com IA
Ele coloca em várias IAs para que revisem umas às outras e gerem mais ideias; começou no ChatGPT, passou por Grok e Claude, e agora o Gemini parece estar produzindo as respostas mais fortes
A situação perfeita para um “Claude, resolve isso aí”
kstrauser: No trabalho temos um grande orçamento de tokens, e um colega encontrou um exploit remoto assustador em um projeto conhecido durante um teste de vulnerabilidades e me pediu uma segunda opinião
Subi o projeto localmente e executei o POC, mas não aconteceu nada, e percebi que era preciso uma configuração que reduzisse as proteções de segurança padrão
Então pedi à IA para corrigir o POC para funcionar também nas configurações padrão, e alguns minutos depois ela o ajustou para uma versão weaponized; baixei, compilei eu mesmo e a instância local que eu tinha acabado de subir com as configurações padrão travou imediatamente
Fiquei olhando para o cursor piscando no console, suando frio como se estivesse segurando uma bomba de informação nuclear, e passei a noite me revirando, dormindo talvez uns 30 minutos
Em compensação, isso deu ao time uma direção ética clara: como podemos fazer isso, devemos fazer esse trabalho e compartilhar os resultados com os autores envolvidos
Quero viver num mundo em que as pessoas boas corrijam os problemas antes que as más os encontrem, então decidi trabalhar para construir esse mundo
Não vejo nenhuma combinação de palavras antes que pareça formar essa sigla
ddxv: Na maior parte do tempo, usar código gerado por LLM dá uma sensação de “ah, que legal!”, mas algumas semanas depois, quando percebo que aquele código “legal” que o modelo entregou dizendo que passava nos testes tinha um bug sutil e que eu não li com cuidado, aí vem o “hã?”
O maior risco é ficar preguiçoso, delegar vários arquivos e muitas mudanças de uma vez e dar YOLO sem entender completamente o que foi feito
No frontend isso geralmente passa, mas em tarefas de manipulação de dados, se você não entende, provavelmente não é o que você queria, e semanas depois você volta para investigar o que mudou
É parecido com a vida antes dos LLMs, quando se copiava e colava do StackOverflow, mas agora a velocidade do copia e cola é muito maior e eles lidam bem com boilerplate, então dá para focar nos edge cases
UncleOxidant: Recentemente, com o Claude, fiz um classificador de MNIST com rede neural de spiking rodando em FPGA para uma demo
O Claude fez a ponte do conceito até PyTorch, treinamento, implementação em Verilog e síntese para FPGA, e também fez um app em que você desenha um número com o mouse no PC e aperta um botão para classificar
Eu precisava enviar os dados do USB para o FPGA via SPI, mas o adaptador SPI ainda estava a caminho, então pedi que ele fizesse o código Verilog rodando no simulador Verilator se comunicar por SPI virtual, e fui almoçar
Quando voltei, o app de desenhar números estava aberto na tela; desenhei um “2”, ele classificou como 2, e em outra janela o simulador Verilator mostrava a transferência dos dados
Foi de arrepiar
HlessClaudesman: Eu estava ouvindo um podcast num café quando ouvi que certo autor de ficção científica escrevia mais de 40 livros por ano, e pensei que só podia ser uma equipe de ghostwriters, uma quantidade absurda de cocaína ou IA
Na era inicial do ChatGPT, baixei um app e pedi que ele passasse por todas as etapas da escrita de um romance — esboço, resumo de personagens, resumo da trama, capítulo rascunho e capítulo final — e, quando pensei em pedir o segundo café, o manuscrito pré-edição já estava pronto
Era um romance horrível, mas havia centelhas que davam para aproveitar e lapidar, e isso comprovou minha hipótese de que a IA podia produzir ficção em massa
Se houvesse cocaína suficiente, parecia até possível chegar a 40 livros por semana com a ajuda da IA
mindcrime: Não me lembro de um único momento específico, mas desde a primeira vez que interagi com o ChatGPT achei bastante impressionante
Eu definitivamente não estava pronto para chamar aquilo de AGI, mas era algo novo, e intuitivamente estava claro que “a IA de hoje será a pior que ela jamais será” e que era difícil prever a velocidade da mudança
Quanto mais eu as uso, mais fico 100% convencido de que faz sentido dizer que elas são inteligentes em certo sentido
Ainda não são AGI nem inteligência em nível humano, mas vejo isso como a “jagged intelligence” de Demis Hassabis: muito inteligentes em alguns domínios e bem menos em outros
Como acredito que pode existir inteligência que não funciona como a inteligência humana, argumentos do tipo “não é inteligência de verdade” quase não têm peso para mim
A propósito, há muito tempo deixo parado um rascunho de blog chamado “The Marquee Sign Says 'Artificial' Intelligence”, mas não pretendo pedir à IA que o escreva no meu lugar
Eu uso IA para pesquisa, esboço e brainstorming, mas mantenho a linha de que qualquer texto publicado com meu nome precisa ter a minha voz real
ben_w: Houve vários momentos assim
O primeiro demo do InstructGPT foi chocante porque eu lembrava de quão ruim era o estado da arte anterior em processamento de linguagem natural, e não esperava passar da qualidade de continuação de texto do GPT-3.x para seguir instruções
Em 2019, This Person Does Not Exist; em 2016, transferência de estilo e tecnologias semelhantes (https://github.com/awentzonline/image-analogies) e o que hoje chamaríamos de deepfake (https://www.youtube.com/watch?v=_S1lyQbbJM4); e em 2015, a atualização OTA de direção autônoma da Tesla (https://www.popsci.com/tesla-cars-become-autonomous-overnigh...) também foram assim
Em 2013, o “man” - “woman” ~= “king” - “queen” do word2vec também me fez pensar “hã?”, justamente por eu conhecer o nível anterior do processamento de linguagem natural; e mais ainda ao pensar em automação de propaganda ou vigilância via compreensão de gírias como Polari
Também me lembro do vídeo de demo do Word Lens de 2010 (https://www.youtube.com/watch?v=h2OfQdYrHRs)
alexfoo: Depois que alguém atualizou o firmware da impressora Brother DCP-L3550CDW, a página CSV usada pelo exporter Prometheus antigo desapareceu, e só restou uma página HTML com as informações enterradas em várias
divEu ia fazer o parsing do HTML manualmente para escrever o exporter, mas resolvi testar o Claude e coloquei numa VM sandbox um arquivo HTML estático da página de status da impressora e um arquivo Go mínimo contendo apenas
fmt.Printf("OK\n")O nome do diretório era
brother-exporter, e eu não dei nenhuma outra instrução, tarefa nem linguagem, mas só com/inito Claude concluiu que precisava escrever um exporter Prometheus em GoEm 10 minutos, ele produziu sem falhas um código que buscava o HTML da impressora no endereço padrão 192.168.1.1, fazia o parsing e expunha métricas para o Prometheus coletar
Se eu fosse fazer isso, levaria algumas horas; o maior choque foi o quanto ele inferiu com precisão a partir de tão pouca informação no começo
tern: No começo foi o Opus 3.x ter montado um sistema de produtividade para mim com o Obsidian MCP, e depois foi descobrir prompts do tipo “construa um modelo matemático do problema e derive a solução a partir dele”
O verdadeiro “ué?” veio quando eu passei um bom tempo especificando um compilador/runtime para DSP em tempo real com muitas ideias novas, e ele de fato funcionou
A sequência foi mais ou menos: me ajuda a me entender → me ajuda a conectar boas ideias → gera novas ideias com a entrada certa → cria ferramentas úteis na minha máquina → usa passagens iterativas para sintetizar boas ideias em ideias melhores → constrói artefatos grandes muito além da minha capacidade normal
A fronteira atual é sintetizar grandes codebases em artefatos melhores por meio de passagens iterativas, e o ponto central é acompanhar se o processo converge e se capitaliza de forma composta, ou se fica girando no mesmo lugar ou diverge
Em março de 2024, ao investigar e implementar um problema de pesquisa difícil em processamento de linguagem natural, senti que dava para aproximar bem só com prompts e a API de completions
Em meados de 2025, o Llama 3 analisou uma codebase bem grande na qual eu estava fazendo onboarding e sintetizou um resultado no nível de diagramas que eu mesmo teria feito como ferramenta decisiva
Em dezembro de 2025, o Opus 4.5 gerou módulos multiclasse e testes quase perfeitamente do ponto de vista sintático, e percebi que os erros vinham da subespecificação no meu prompt
Hoje quase não escrevo código à mão, porque fica bom o suficiente e ainda vêm de graça os extras como testes, documentação e scripts de build
notthetup: Eu tinha umas gravações de áudio de shows bem únicas que foram corrompidas ao mover arquivos durante um backup
Parecia que os dados ainda estavam lá, mas nenhum software conseguia reproduzi-los, então deixei isso parado por 5 anos até tentar recuperar com ferramentas de IA
Depois de 20 minutos com o Copilot e de fuçar bastante em dumps hexadecimais, no começo saiu uma solução meio funcional que só reproduzia os primeiros segundos do arquivo, mas no fim consegui recuperar todos os arquivos
nwhitehead: Um caso da minha esposa: hoje ela usou o Claude para diagnosticar um bug que travava a progressão em um jogo da Steam que ela queria muito jogar
Levou 18 minutos, mas ele desempacotou o pacote do Godot, identificou o bug, sugeriu uma correção e ainda explicou uma forma de contornar dentro do jogo
Eu não precisei fazer nada; o Claude usou
stringspara entender a estrutura do arquivo.pcke depois escreveu código Python com magia específica de Godot para extrair um chunk em particularsimonw: Foi por volta de março de 2023, quando vi o ChatGPT Code Interpreter
Eu subi um CSV de ocorrências da polícia de San Francisco, ele leu com Pandas, mostrou gráficos e depois exportou os dados para um arquivo de banco SQLite para eu baixar
Como alguém que cria software para jornalistas de dados, pareceu que só o efeito colateral de poder rodar Python na pasta onde ficam os arquivos enviados já bastava para fazer tudo o que eu queria de um software
Olhando para trás, foi meu primeiro contato com um agente de código, embora naquela época nem existisse esse nome para a categoria
mlmonkey: Um amigo consultor encontrou um nicho em Netsuite e Oracle e, vindo da contabilidade, ganhava muito dinheiro configurando instâncias de clientes e jogando bastante golfe
Logo depois de o ChatGPT se popularizar, eu estava empolgado falando sobre o potencial da IA, e ele tentou cortar o assunto dizendo “isso não vai conseguir fazer o meu trabalho”, então foi para casa testar no notebook
Ele inseriu as especificações de configuração do Netsuite que normalmente recebe do cliente, junto com várias opções e parâmetros, e pediu os comandos de configuração; o ChatGPT então listou um monte de comandos a executar e opções a definir
Meu amigo desanimou e disse “esses são exatamente os comandos que eu executo”, mas depois conseguiu manter alguns clientes estáveis entre empresas fechadas de donos que ele já conhecia, o bastante para continuar bancando o hobby de jogar golfe
Mesmo que os clientes possam rodar o ConsultBot 2.0 por conta própria, eles sabem, como sempre souberam, que estão entregando isso a mãos confiáveis
djfergus: Eu tinha um Amazon Firestick de primeira geração parado numa gaveta havia anos, e ele foi atualizado para o software mais recente, sem exploit público de root disponível
Passei um dia inteiro alternando entre Claude e Codex para pesquisar o assunto; depois de baixar o código-fonte do kernel e tentar exploits, consegui acesso root com um “FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory”
Consegui tornar o root persistente, remover os apps da Amazon e fazer downgrade do firmware, e isso me deixou animado com um futuro em que mais hardware antigo e novo poderá ser reaproveitado
PopePompus: Eu estava recriando com Claude Code, como app Android, um antigo aplicativo de astronomia que eu tinha escrito para o Nokia N900 na era anterior à App Store do iPhone
O app original tinha várias páginas de visualização, como posições dos planetas, e eu estava pedindo a recriação página por página apenas com descrições das telas, sem mencionar em nenhum momento o código original nem sua existência
Depois de recriar várias páginas, o Claude acrescentou mais uma página que eu não tinha pedido; essa página existia no app original do Nokia, mas eu ainda não tinha dito para adicioná-la ao app Android
O código do app para Nokia ainda estava no GitHub, e pareceu que o Claude somehow conectou o trabalho que eu pedi com o código Nokia no meu repositório GitHub, implementando exatamente a página que faltava de um jeito de cair o queixo
vitorbaptistaa: Eu era CTO de uma pequena ONG de 10 pessoas e, na época, só havia um desenvolvedor júnior, enquanto dávamos suporte a dois apps feitos por consultores
Era uma arquitetura caótica com NextJS, React e 4 microsserviços acoplados a um site com 50 usuários por semana
Preparei um
devcontainercom a base de código antiga e um repositório vazio, pedi ao Claude para reescrever tudo como um app Django com renderização no lado do servidor, fui dormir e, de manhã, 80% já estava prontoDepois de mais alguns dias de prompts e revisão, chegamos à equivalência funcional, e fizemos o mesmo com o outro app
Agora os dois estão em produção, com menor custo de servidor e menos complexidade, várias vezes mais rápidos, e para uma organização pequena a IA é incrivelmente útil por tornar possível algo que, sem agentes de IA, provavelmente nunca sairia do papel, como costuma acontecer com dívida técnica
dang: Um grande momento foi quando vi isso analisar arquivos de log em poucos segundos
Se fosse eu, levaria horas, na prática dias, e por isso era o tipo de coisa que eu nem teria feito
Também me ajudou a superar a barreira de entrada de otimizações que eu vinha adiando há anos por falta de tempo para aprender, especialmente para rastrear bugs de concorrência como race conditions
Também encontrou informações que eu não conseguia achar no Google (https://news.ycombinator.com/item?id=42653136); o ponto em comum é que não eram coisas impossíveis, e sim coisas que não aconteciam porque o custo de tempo e esforço era alto demais — agora elas realmente acontecem
Quando apontei a extensão problemática do ADO, ele baixou o VSIX, descompilou o binário .NET para confirmar, e com base nisso propôs uma solução alternativa na qual eu estava muito cético, mas que de fato funcionou
Tecnicamente eu também conseguiria fazer isso, mas provavelmente não faria porque o retorno era incerto e levaria tempo demais
Ontem ele apareceu no topo do meu GitHub, expliquei o problema e o Claude encontrou o bug imediatamente; após algumas rodadas de conversa, produziu uma correção com a qual fiquei satisfeito
Agora acho que vou conseguir fazer o lançamento final, e é uma sensação boa finalmente concluir algo tão antigo
hgoel: Recentemente tentei pedir ajuda ao Claude para aprender desenho, especialmente anatomia
Enviei um esboço e pedi feedback; ao contrário do que eu esperava, foi muito útil e explicou com precisão pontos que ninguém nunca tinha apontado, mas que eu sentia que estavam estranhos
Por curiosidade, pedi que rotulasse os problemas sobre o próprio esboço, e ele escreveu um script em Python com coordenadas e colocou os rótulos ele mesmo
Como ainda existe a percepção de que vLLM não é grande coisa para tarefas visuais, receber conselhos de desenho realmente úteis foi bastante surpreendente
Era feedback anatômico, tipo “o braço não se prende aí”, ou técnica de desenho, como dicas de luz e sombra?
takee: Eu estava fazendo com meu filho de 10 anos um experimento de eletromagnetismo para apresentar na feira de ciências da escola, e surgiu um problema que eu não conseguia depurar sozinho
Abri uma videochamada ao vivo com o Gemini e pedi ajuda para descobrir a causa; ele explicou claramente os possíveis problemas e no fim conseguimos fazer o dispositivo funcionar como esperado
A causa era que o isolamento do lado da conexão da bateria no fio enrolado no parafuso não tinha sido removido direito, e o Gemini captou detalhes que eu não conseguia ver a olho nu
Meu filho e dois amigos dele ficaram impressionados não só com o experimento em si, mas também com o fato de uma conversa por voz e vídeo em tempo real com IA parecer quase mágica
lodovic: Fiquei chocado quando colei uma captura de tela de uma thread de revisão de PR e só disse “havia comentários de revisão, então corrige aí”, e ele resolveu tudo perfeitamente, fez pequenos commits e mandou para o upstream
Depois disso, continuei jogando tarefas impossíveis, projetos enormes e arquiteturas complexas para ver até onde ele entendia a minha intenção
Recentemente, trabalhando algumas horas por dia durante uma semana, ele escreveu do zero um SO completo com MPI, TCP/IP e GUI, e ainda roda Doom
Programação como profissão acabou, mas a diferença nos resultados é tão grande quando se aborda isso com mentalidade profissional que eu ainda acho que a disciplina de engenharia de software continua tendo enorme valor
jmkni: Não foi programação, foi leitura de logs
Eu estava tentando encontrar um bug de pesadelo que só acontecia em produção, e o Claude Code conseguia se conectar ao Google Cloud e ler os logs em tempo real
Reproduzi o bug na UI, e ele imediatamente identificou o problema nos logs; como também tinha o contexto de toda a base de código, apontou até a linha exata que causava o problema
Foi definitivamente um momento de “opa?”
marcus_holmes: Tirei uma foto de uma planta murchando e mostrei ao Claude, e ele me disse como fazê-la voltar a ficar saudável e como propagá-la por estaca
Os exemplos de código fazem sentido porque é um computador falando sobre computadores, mas mostrar ao computador uma foto de planta e ele reconhecer a planta, diagnosticar o problema e saber o que fazer pareceu ficção científica, e foi realmente impressionante
bonoboTP: O maior momento foi logo após o lançamento do ChatGPT em 2022, especialmente quando ele fazia roleplay como um terminal Linux e, depois de descrever que “houve um incêndio no datacenter”, você “executava”
nvidia-smie a temperatura da GPU aparecia altaTambém dava para “explorar” o diretório home ou o diretório home de pessoas famosas, e, se ele entendia tão bem um terminal, eu tinha certeza de que uso de ferramentas e agentes estavam logo ali
O Opus 4.5 me deu a sensação de que isso finalmente chegou, mas em 2022 eu na verdade achava que viria mais rápido, em 2023~2024
Do lado de imagem, foi vendo nano banana que senti que imagens de IA realmente funcionavam, e ficou claro que problemas temporários como mãos/membros ou “não consegue fazer um astronauta montado num cavalo” iam desaparecer
Fazer longas-metragens também entrou no campo do possível, com agentes gerando e coordenando roteiro, personagens e tomadas; independentemente de ser uma história que valha a pena ver, vai ser um “filme”
Depois houve tarefas mais impressionantes, mas nada me jogou naquele mesmo tipo de puro assombro
jb_briant: Estou fazendo um jogo 3D e não queria um mundo plano, então quis usar um planeta
A superfície não se expande, então para a jogabilidade é finita, mas ao mesmo tempo parece infinita porque você nunca bate na borda do mundo, e isso era elegante
Coordenadas cartesianas não serviam muito bem para o jogador, então eu precisava de um sistema de grade de latitude/longitude/altitude, e eu poderia passar dias fuçando no StackOverflow e depurando uma implementação cheia de falhas
Em 2024, a versão web do ChatGPT fez praticamente todos os helpers de uma vez só, e isso foi impressionante porque havia muitas armadilhas
Jogo retrô de arcade inspirado em Rally-X rodando no navegador: https://linsomniac.github.io/rally-xy/
Também fiz um jogo de tiro em labirinto com multiplayer em rede no estilo nsnipes; é baseado em navegador, mas o multiplayer em rede precisa de servidor: https://github.com/linsomniac/isnipes
vishvananda: Foi no começo deste ano, quando peguei projetos antigos parados e os entreguei para agentes
Em poucos dias, fizeram um clone da implementação de AlphaZero que eu havia criado na equipe da Oracle (https://medium.com/oracledevs/lessons-from-implementing-alph...), portaram meu emulador de NES de hobby de JavaScript para Rust (https://github.com/vishvananda/popeye) e implementaram todas as lições do C++ Grandmasters Challenge, o que acabou levando até um compilador C++ completo (https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...)
Em especial, a portabilidade do emulador de NES levou menos de 30 minutos e funcionou na primeira tentativa
O que ligou a chave foi mandar refazer coisas que eu antes tinha construído com meu próprio suor, e, por eu conhecer a dificuldade, isso me bateu muito mais forte do que outros projetos
a_bonobo: No emprego anterior, eu organizava registros não verificados de avistamentos de animais, e separadamente havia um banco de dados de probabilidades de ocorrência de animais com base em mapas de distribuição das espécies
Não sou estatístico, mas, dado um avistamento, a probabilidade-base de ocorrência naquela região e algumas suposições sobre o ruído do avistamento, parecia um caso perfeito para o teorema de Bayes calcular a probabilidade de aquela espécie realmente estar incluída
O Claude fez três perguntas, consultou os mapas e escreveu uma bela implementação em Python que cuspia uma tabela de probabilidades ajustadas
Deu uma sensação poderosa de que agora dá para fazer esse tipo de coisa “sozinho”, sem esperar encontrar a pessoa certa ou aprender primeiro o conhecimento exato
dannyobrien: Consegui acesso inicial à API da OpenAI antes do ChatGPT, e foi por volta de 2019, quando no trabalho estávamos preparando jogos JackBox em livestream para um evento beneficente
Eu já tinha trabalhado como roteirista da versão britânica do jogo original You Don't Know Jack, produzindo muitas piadas curtas engraçadas sobre um tema e usando só algumas na gravação
Como experimento, coloquei esse tipo de prompt de configuração na API da OpenAI; 90% não tinham graça ou eram incoerentes, mas 1 em cada 10 não era ruim ou até era bem boa
Talvez isso não impressionasse outras pessoas, mas, como eu já tinha vivido o ambiente de uma sala de roteiristas em que todo mundo passava horas fazendo esse tipo de coisa, percebi que isso poderia ser o complemento perfeito como ferramenta de apoio criativo
Também era bem boa como jogadora de JackBox
xtracto: Posso ser criticado por isso, mas com ajuda de LLM escrevi um pequeno programa que captura o vídeo de um jogo FPS online do Xbox Live na tela do navegador e, com uma pequena rede neural treinada, reconhece formas humanas e as exibe em outra tela
Em partidas PVP, ele coloca um overlay verde sobre os inimigos para deixá-los mais visíveis, e incluindo o treinamento/ajuste fino de uma pequena rede YOLO, tudo ficou em cerca de 100 linhas de código
Para quem não conhece, pode parecer cheat, mas em essência é prática de visão computacional
Ferramentas do tipo DMA na área de modding de jogos também ganham dinheiro com serviços por assinatura, então é impressionante e estranhamente sigiloso ao mesmo tempo, e também é interessante ver o quão bem essas ferramentas e o hardware mux funcionam
Se isso se combinar até com hardware como DGA, com memória onboard e interconexões mais rápidas, será um momento muito interessante para quem conhece as áreas de engenharia reversa, análise de malware e forense
tejohnso: Não houve um momento de pânico exatamente, mas no último ano minha forma de abordar programação mudou
Antes, ao começar um projeto, eu pensava sozinho na estrutura, na interação entre as grandes partes, na implementação dos detalhes, nas alternativas e nas consequências
Agora, em vez de pensar sozinho, vou avançando conversando com um LLM, reunindo informações rapidamente de várias fontes, pedindo links para materiais canônicos e perguntando sobre os trade-offs entre alternativas que eu nem tinha considerado, chegando assim a análises mais detalhadas
Durante o desenvolvimento, também mantenho esse novo parceiro agente no contexto o tempo todo, usando-o para discutir, sugerir e resolver problemas
Não dá para confiar completamente, mas para os meus objetivos ele se tornou uma ferramenta de fluxo de trabalho confiável o bastante, e foi muito rápida a velocidade com que passou de brinquedo interessante a ferramenta totalmente integrada
tobyhinloopen: Um funcionário não técnico do cliente criou um app com vibe coding, e me pediram para revisar e fazer o deploy
O resultado ficou bom e não havia problemas graves
Ao mesmo tempo, joguei no Claude o PDF inteiro com o feedback do cliente, screenshots e tudo mais, e durante 7 horas ele fez reproduções e correções quase sem supervisão, criando vários MRs
A maioria das correções foi boa; algumas estavam tecnicamente certas, mas não eram o que o cliente queria, então eu disse isso e o Claude corrigiu
Por isso criei uma startup em torno dessa ideia
rerdavies: Eu estava trabalhando em um compilador Spice que transforma esquemas de circuitos de pedais de guitarra clássica em código executável em tempo real
Dei ao Claude os números das páginas e das equações do The Spice Manual 2nd ed. e pedi a implementação, sem realmente esperar que desse certo
Mas ele implementou não só aquelas equações como também o cálculo do lagrangiano de uma função que estava 30 linhas abaixo, o que exigia derivadas parciais simbólicas de uma função nada trivial e descobrir no resultado da matriz qual variável era o quê
O texto original dizia apenas “Lagrangian of” e não fornecia as equações diferenciais parciais, mas mesmo assim ele conseguiu, e ainda adicionou comentários com a página de origem e o número da equação para essa equação lagrangiana
Eu poderia simplesmente pedir isso ao Claude, mas queria saber se você pretende compartilhar