A IA de fronteira quebrou o formato dos CTFs públicos

(kabir.au)

1 pontos por GN⁺ 2026-05-17 | 1 comentários | Compartilhar no WhatsApp

A IA de fronteira automatizou problemas fáceis e médios de CTF (Capture The Flag) online públicos, fazendo com que o placar deixe de refletir com clareza a habilidade humana em segurança
O problema não é a assistência de IA em si, mas o fato de os modelos terem chegado ao ponto de assumir o raciocínio e a escrita do código de solução, deixando para o humano apenas copiar a flag
Depois do Claude Opus 4.5 e do Claude Code, ficou fácil subir um agente por desafio via API do CTFd para resolver os problemas iniciais, enquanto as pessoas focam nos mais difíceis
O GPT-5.5 Pro já consegue resolver de uma vez até um active leakless heap pwn de dificuldade Insane no HackTheBox, favorecendo quem consegue bancar tokens e custo de agentes
Como o placar público passou a medir também orquestração de IA e capacidade de pagamento, a escada dos CTFs — em que iniciantes evoluíam até chegar aos times do topo — enfraqueceu

O placar dos CTFs online públicos mudou

A IA de fronteira quebrou o formato dos CTFs públicos, e o placar já não mede de forma limpa a habilidade humana em segurança
O ponto central não é que a IA dê dicas, mas que os modelos fazem o raciocínio e escrevem o código da solução, deixando para a pessoa apenas copiar a flag
Antes, CTF não era só um conjunto de puzzles, mas uma escada pela qual iniciantes ganhavam habilidade e subiam para times e competições maiores
O desempenho em CTFs online públicos passou a refletir não só habilidade em segurança, mas também disposição para usar modelos de fronteira, montar automação e investir tokens suficientes
O formato atual dos CTFs online públicos dificilmente consegue manter o papel que tinha no passado, e é difícil fingir que nada mudou de forma fundamental

O contexto da mudança

Experiência com CTF e a inquietação
- Em 2021, junto com a entrada na universidade, começou no CTF e venceu seu primeiro torneio, o HCKSYD, um CTF solo de 48 horas, resolvendo tudo em 2 horas
- Depois, junto com a Blitzkrieg, venceu várias vezes o DownUnderCTF, o maior CTF da Austrália, e mais tarde entrou para o time internacional de elite TheHackersCrew
- O TheHackersCrew manteve posições altas no CTFTime e frequentemente ficou entre os 10 melhores em CTFs globais até o fim de 2025
- O CTF foi o que despertou o gosto por segurança, serviu como forma de aprendizado, de medir a própria evolução e de conhecer muitas pessoas respeitadas
A primeira mudança após o GPT-4
- Depois do GPT-4, uma parte significativa dos problemas de dificuldade média em CTF passou a ser resolvida em one-shot, com solução e flag obtidas em um único prompt
- Passou a ser possível colar um problema de criptografia no ChatGPT e voltar 10 minutos depois com a resposta
- Na época, os problemas difíceis em geral eram menos afetados, e o tempo economizado ainda não parecia grande o bastante para arruinar a competição
- Como jogadores de CTF sempre usaram ferramentas, o problema não era a assistência de IA em si, mas se ela havia chegado ao ponto de eliminar trabalho humano significativo

A mudança de formato provocada pelo Claude Opus 4.5

Depois do Claude Opus 4.5, quase todos os problemas de dificuldade média e alguns difíceis passaram a poder ser resolvidos por agentes
O Claude Code unifica tudo em CLI e facilita a conexão com outras CLIs e ferramentas MCP, tornando simples montar um orquestrador que cria uma instância do Claude para cada desafio via API do CTFd
Isso permite usar o sistema para resolver problemas fáceis e médios na primeira hora da competição, deixando as pessoas focarem apenas no que sobra
Um time que não usa IA não está só abrindo mão de conveniência: está jogando uma versão mais lenta da competição
O CTF online público virou um jogo de automatizar o mais rápido possível os problemas fáceis e médios, e preservar o máximo de atenção humana para os mais difíceis
O placar começou a medir, junto com a habilidade em segurança — e às vezes mais do que ela — a capacidade de orquestração e a disposição para usar modelos de fronteira
O ranking do CTFTime passou a parecer estranho, com times lendários que antes estavam sempre no topo aparecendo menos, e com a atividade dos jogadores parecendo menor
Se autores passam semanas criando desafios sofisticados e agentes os resolvem em minutos, a motivação para tratar CTF como uma forma de arte também diminui

A mudança decisiva após o GPT-5.5

GPT-5.5 e GPT-5.5 Pro parecem, pelos benchmarks, estar perto do Claude Mythos ou, no caso do Pro, possivelmente até acima
Esses modelos conseguem resolver em one-shot um problema de active leakless heap pwn de dificuldade Insane do HackTheBox
Eles já cobrem uma grande parte do tipo de desafio que um organizador pequeno de CTF consegue criar de forma realista, e orquestrar o Pro em problemas Insane durante um CTF de 48 horas pode render a flag antes do fim da competição
Como resultado, os CTFs públicos passam a ter um caráter de pay-to-win
Quanto mais tokens um time consegue investir na competição, mais rápido ele pode descer o placar
Modelos especializados em cibersegurança, como o alias1 da Alias Robotics, tendem a se tornar menos importantes em comparação com LLMs de fronteira gerais
A disputa passa a ser sobre quem consegue pagar para rodar agentes suficientes, com contexto suficiente e por tempo suficiente
O desempenho em CTF deixa de definir a habilidade individual como antes, e também perde força como sinal na contratação de profissionais de segurança
Como grande parte da orquestração necessária para CTF já é open source ou pode ser criada com código gerado por vibe coding, isso também não é um bom indicador de habilidade com IA

O dano ao caminho de aprendizado dos iniciantes

O placar era uma escada de aprendizado
- CTF era uma escada em que iniciantes resolviam mais desafios, alcançavam posições mais altas, entravam em times melhores e se tornavam mais competitivos
- Quando o placar público é dominado por times que usam IA, o iniciante é ultrapassado pelo uso de IA antes mesmo de desenvolver a intuição que a IA substitui
- Isso é um antipadrão para o aprendizado ativo, porque a parte que realmente ensina é o esforço direto e o enfrentamento das dificuldades
- Mesmo com esforço real, se os degraus superiores da escada forem automatizados e o crescimento visível desaparecer, a motivação cai muito
Diferença entre CTF para iniciantes e plataformas de aprendizado
- Se até CTFs para iniciantes virarem espaços em que as pessoas só colam prompts em silêncio para subir no placar, faz mais sentido para quem cria desafios investir em plataformas de aprendizado
- Em plataformas como picoGym e HackTheBox, a expectativa é educativa, e o incentivo para o iniciante enganar a si mesmo é menor do que em um placar público
- Para iniciantes, é melhor aprender em picoGym, HackTheBox e outros ambientes de laboratório do que em competições cujo placar público finge refletir crescimento humano

O limite do contra-argumento “CTF não morreu”

O argumento de que a IA não consegue resolver tudo e de que CTFs como a DEF CON ainda existem é parcialmente verdadeiro, mas não responde ao ponto central
Os problemas mais difíceis das finais de elite têm pouquíssimos participantes e normalmente só são acessíveis por meio de qualificatórias, que são mais fáceis que a final
Se as qualificatórias colapsam por causa dos agentes, diminui o número de pessoas realmente qualificadas para chegar aos desafios que ainda resistem à IA
Um pequeno grupo de finais de elite não salva o formato online público que é o que a maioria das pessoas de fato joga
A questão não é que toda prova possa ser resolvida, mas que uma parte grande o bastante do placar foi automatizada e perdeu o significado que tinha antes

Pesquisa em segurança e CTF competitivo não são a mesma coisa

CTF pode mostrar técnicas novas e interessantes, mas nunca foi, por si só, o lugar da descoberta em pesquisa de segurança
O fato de a IA ser útil em segurança não leva automaticamente à conclusão de que ela deva entrar sem limites no ambiente competitivo desse campo
Em CTF, a IA sem restrições quase remove os humanos do puzzle e reduz a dimensão artística da segurança a prompts
Os LLMs continuarão elevando a capacidade em segurança enquanto CTF existir, mas isso não significa que o formato competitivo esteja saudável
O CTF era uma forma de compartilhar técnicas e empurrar os limites da habilidade humana em segurança, e esse propósito está sendo esvaziado

O problema da analogia com engines de xadrez

O xadrez é dominado por computadores há muito tempo, mas engines de xadrez não podem ser usadas durante partidas competitivas
As engines são usadas para análise, treino, comentários e prática, enriquecendo o ecossistema ao redor da competição sem substituir o competidor
Se todos os enxadristas recebessem a melhor engine e pudessem usá-la livremente durante as partidas, surgiriam dúvidas sobre justiça, valor como espetáculo, justificativa para prêmios e até se isso ainda empurra limites humanos
As mesmas perguntas se aplicam ao CTF

Por que é difícil para os organizadores reagirem

Organizadores de CTF tentaram técnicas para quebrar ou desencorajar soluções por LLM, mas a maioria gera apenas atrito temporário
O Claude Code não é afetado de forma significativa pelos velhos truques de strings de rejeição
Modelos de fronteira estão cada vez melhores em perceber prompt injection
A busca na web enfraquece a defesa de problemas baseados em técnicas surgidas depois do cutoff de treinamento
Regras proibindo LLM tendem a ser ignoradas em eventos online públicos e quase não têm como ser aplicadas
Se os organizadores criam problemas comuns, os agentes resolvem demais; se criam problemas hostis a agentes, eles tendem a virar desafios de adivinhação, excessivamente engenheirados e desagradáveis também para humanos
Essas respostas não são soluções reais: só tornam o CTF pior para todo mundo

A lacuna no “é só se adaptar”

Se adaptar, no sentido de criar ferramentas melhores, é algo que jogadores de CTF já fazem há muito tempo
Se adaptar, no sentido de escrever problemas mais difíceis, também é algo que organizadores já tentam
Se adaptar significar aceitar que o placar virou um benchmark de orquestração de IA, então é melhor dizer isso com honestidade em vez de fingir que a competição antiga ainda existe
Mesmo que se criem problemas de adivinhação ou excessivamente engenheirados que os LLMs ainda não resolvem, isso não oferece um bom caminho para aprender as habilidades necessárias e continuar competitivo
E, depois de mais alguns modelos, até isso pode deixar de fazer sentido, porque a evolução da capacidade de IA em segurança avança rápido demais para o design de problemas ficar muito tempo à frente

O impacto no cenário atual de CTF

O ranking do CTFTime passou a refletir muito pouco da história e da habilidade humana, e o placar de 2026 ficou irreconhecível em relação aos anos anteriores
Muitos times grandes e respeitados, incluindo o TheHackersCrew, pararam totalmente de jogar, passaram a jogar com muito menos gente ou têm dificuldade para entrar no top 10
A trapaça sem controle aumentou muito, e alguns bons CTFs, como o Plaid CTF, já não acontecem mais
Muitos membros do time local Emu Exploit sentem o mesmo; são pessoas que participam regularmente do International Cybersecurity Championship, têm resultados fortes em programas de bug bounty, competem no Pwn2Own e apresentam em conferências como a Black Hat
Quem está perdendo o interesse não são espectadores casuais, mas justamente o tipo de pessoa que o cenário de CTF sempre atraiu e reteve
A perda não é só do placar, mas da escada que ligava a curiosidade do iniciante à competição de elite, do artesanato no design de problemas e da sensação humana de entender algo difícil em profundidade para então resolvê-lo
O CTF online público, como está hoje, tem dificuldade para sustentar esse legado, e negar a necessidade de mudança fundamental só torna mais difícil falar dessa perda com honestidade

O que precisa permanecer daqui para frente

Embora muita coisa ao redor de CTF e IA esteja sendo comercializada e saia do controle da comunidade, o CTF teve um impacto muito positivo na indústria
Por meio do CTF, muita gente gentil, inteligente e apaixonada foi conhecida, além da experiência de problemas belamente construídos e soluções inesperadas e interessantes
A comunidade de CTF foi um excelente espaço para aprender, crescer e criar vínculos, e essa parte não pode se perder, independentemente do rumo da competição
A comunidade precisa continuar unida, manter a paixão e criar novos caminhos para seguir aprendendo
Eventos sociais ligados à segurança, como SecTalks, conferências estudantis e meetups locais, são boas formas de manter conexão e participação
Plataformas de aprendizado que oferecem comunidade, como no Discord, também são recursos valiosos
Mesmo que seja difícil encontrar um substituto equivalente ao que existia antes, a comunidade construída em torno do CTF se torna ainda mais importante agora para encontrar novas formas de manter vivo o espírito competitivo

1 comentários

GN⁺ 2026-05-17

Comentários do Hacker News

Dá vontade de implorar para que, quando usarem uma sigla pela primeira vez, escrevam o nome completo ao menos uma vez. Mesmo que 90% dos leitores já saibam, os outros 10% agradecerão, quase não dá trabalho e isso amplia o alcance do texto ou da ideia.
A exceção é quando a própria sigla é tão famosa que muita gente conhece bem o conceito, mas não sabe do que ela originalmente é abreviação. Lembro de uma vez, num treinamento da empresa, quando ouvi “Border Gateway Protocol”, pensei por um instante e depois: “ah, você quer dizer BGP?”
- Fiquei curioso sobre qual sigla você está falando. Se for CTF, eu diria que, assim como BGP, a sigla em si é mais conhecida do que sua forma por extenso.
  De forma mais geral, nem todo texto é para todo leitor. Se você escreve um post de blog sobre CTF para pessoas que gostam de CTF, não precisa explicar CTF ao público-alvo. No fim, o HN é um agregador de links, mas às vezes é como escutar a conversa dos outros sem ter todo o contexto
- Como este é o comentário do topo agora, vou deixar registrado: CTF é a sigla de Capture The Flag.
  Pessoalmente, acho que nunca ouvi esse conceito ser chamado por esse acrônimo de iniciais. No meu círculo quase nunca foi assunto, então é só isso mesmo
- Acho que muitas siglas não ficam muito mais claras só pela expansão. Recentemente eu estava explicando o que é CI, e a pessoa perguntou do que era sigla; aí percebi que “Continuous Integration” é quase inútil para alguém que está tentando entender o que CI realmente é
Se trocar “CTF” por “ensino médio” ou “universidade”, isso vira uma descrição de um colapso lento da educação. O único alívio é que a maioria ainda exige presença física.
Parece que descobriram o pipeline para substituir humanos, mas ainda não descobriram o da educação. LLM pode ser um professor excelente, mas é quase impossível resistir à tentação de dizer “faz isso por mim”
- Tudo o que aprendemos nos últimos 10 anos aponta para o fato de que computadores não ajudam em nada na educação humana. Memorizamos melhor escrevendo com caneta e papel, e aprendemos melhor com quadro branco e livros físicos.
  A solução simples é remover quase toda computação da educação. Um composition book azul, lápis e quadro branco treinam seres humanos. Calculadoras podem ajudar, mas talvez um ábaco seja ainda melhor. Para enfrentar a informação reciclada gerada por IA, precisamos de humanos capazes de pensar criticamente a partir dos primeiros princípios
- Estou conduzindo entrevistas para contratação de desenvolvedores de software e transformamos a primeira etapa em entrevista presencial para evitar fraude. A diferença entre quem aprendeu antes da IA e quem aprendeu depois é enorme.
  Um desenvolvedor com 3 anos de experiência e diploma em software não conseguia escrever nem fizzbuzz sem IA
- Seria algo como “A IA de fronteira destruiu o formato ‘ensino médio’ ou ‘universidade’”?
  O hype em torno de IA no geral cansa. De um lado, dizem que uma nova era da humanidade começou e em breve dominará todo o universo; do outro, dizem que a sociedade inteira está desmoronando.
  Na educação, em especial, parece que todo mundo está levantando as mãos e dizendo que não há nada a fazer. A solução é simples. Faça a avaliação dos alunos presencialmente. Só isso. Qualquer outro “colapso da educação” não é por causa da IA, mas por outros motivos
- Então seria um excelente professor que fornece informações não confiáveis com convicção?
- Achei bem marcante esta entrevista [0] no podcast Oxide & Friends sobre IA no ensino de CS.
  Claro, CS da Brown University não representa toda a educação, mas ainda assim é uma perspectiva interessante.
  [0] Episode webpage: https://share.transistor.fm/s/31855e83
Concordo com a premissa do texto, mas fico esbarrando nisso o tempo todo.
Ele diz “o problema nunca foi que a IA pudesse ajudar”, e nas três frases seguintes afirma que o problema real é justamente a ajuda da IA.
“Equipes que não usavam IA não estavam apenas abrindo mão de conveniência; estavam competindo numa versão mais lenta da disputa.”
“O CTF não era apenas um conjunto de puzzles. Era uma escada.”
“A afirmação não é que todos os desafios foram resolvidos. A afirmação é…”
“O que se perdeu não é apenas o placar. É a escada para…”
Desculpem, mas isso fica me saltando aos olhos. Sou só eu?
Recentemente eu estava criando uma ferramenta de ofuscação e fazia o modelo desofuscar o código e otimizá-lo de volta à forma original; depois eu seguia melhorando a ferramenta de ofuscação até ele não conseguir mais. O engraçado é que, ao passar por esse processo, acabei também com uma ferramenta de desofuscação e otimização provavelmente mais poderosa do que a maioria das ferramentas comerciais.
A solução é apenas tornar os CTFs mais difíceis, mas em que ponto um CTF fica difícil demais? Talvez mesmo um CTF “difícil” seja, no fundo, simples demais, a ponto de sempre se reduzir a uma cadeia lógica e a uma busca exaustiva pela resposta. Afinal, as formas de esconder a solução diante dos seus olhos são limitadas.
Ou talvez a criatividade humana já tenha se esgotado e não seja tão infinita quanto pensávamos. Só o tempo dirá.
Também me ocorreu outra ideia. Dá para esconder duas flags, mas fazer com que uma delas só possa ser encontrada por um agente de IA, e não por humanos ou ferramentas feitas por humanos
- Interessante. Fiz quase a mesma coisa recentemente. Para levar os limites de uma ferramenta de ofuscação JS ao máximo, eu fazia gpt/claude desofuscarem continuamente a saída final e depois usava gpt de novo para melhorar a ferramenta até quebrar esse desofuscador.
  Você publicou isso em algum lugar? Tenho um exemplo de saída da minha ferramenta de ofuscação JS aqui: https://gist.github.com/Trung0246/c8f30f1b3bb6a9f57b0d9be94d...
- Algumas partes podem simplesmente exigir projeção astral, e computador não consegue fazer isso. Ou então talvez baste adicionar minigames em VR, como os anos 90 sempre imaginavam
Entendo a sensação deste texto. Para mim, a IA estragou tanto jogar CTF quanto criar desafios de CTF.
O mais irritante é a atitude de “não sei bem, mas aqui está a flag”.
Antes, quando eu fazia CTF com amigos, a gente ficava horas quebrando a cabeça em um desafio, até que outro amigo entrava, olhava junto e resolvia em 30 minutos; e isso era uma das experiências de aprendizado mais gratificantes. Hoje em dia o amigo chega, joga no clanker e resolve em 5 minutos. Quando você pergunta como funcionou, a resposta é sempre “não sei o que ele fez, mas quem liga? A flag está aqui”.
Ao criar desafios, é a mesma coisa. Se você pede um write-up ou pergunta se alguém resolveu de outro jeito, normalmente recebe “não sei, o clanker resolveu”, e a graça some.
Então, para mim, esse formato de CTF realmente morreu. O principal motivo é o caráter fortemente competitivo e a premiação em dinheiro. Essa estrutura levou as pessoas a resolverem desafios na base da malandragem, e antes tudo bem, porque resolver de um jeito inusitado também era um momento de criatividade. Mas agora, por causa da IA, não precisa de cérebro, nem de malandragem, nem de humano. Como foi dito, é uma estrutura de pagar para vencer.
Acho que os CTFs 24/7 vão ganhar mais destaque. Neles o placar não importa e não há premiação em dinheiro
Falando de meta, este texto foi enviado originalmente com o título “The CTF scene is dead”, que era bem fácil de entender. Mas agora mudou para a primeira frase do subtítulo, “Frontier AI has broken the open CTF format”, e ficou muito mais difícil de compreender. Lê-se quase como uma garden-path sentence.
No começo achei que “Frontier” era o nome de uma empresa e que CTF era algum formato de arquivo. Se você não conhece competições de Capture The Flag, essa mudança não ajuda. E se conhece, eu diria que piorou
- Talvez ajude, mas para mim o segundo título é muito mais compreensível, parece menos caça-clique e traz mais informação. Concordo com a observação sobre a confusão, mas frontier é um termo bastante usado nessa área, então escrever “frontier AI models have” talvez resolvesse
- Concordo. Levei um momento para entender. Acho que porque foi a primeira vez que vi “frontier models” expresso como Frontier AI. Especialmente com F maiúsculo, soa como nome de empresa
- Em “Frontier Model”, Frontier é um vocabulário legítimo que em 2026 provavelmente já será algo que se espera que você conheça. Não é um termo inventado pelo autor nem escolhido aleatoriamente; é uma expressão comum nessa área
- Em nenhum lugar do texto CTF é definido, e os comentários do topo aqui também não fazem isso. Então passei adiante.
  A regra básica é definir toda sigla na primeira vez em que aparece
- Por que as pessoas sempre sequestram a thread para falar do título? A maioria dos títulos de textos é péssima. É só dar downvote e seguir em frente
Isso também está acontecendo em outras formas de programação competitiva. As IAs mais recentes já têm capacidade de resolução de problemas comparável à de humanos de elite e, se não for fácil proibir IA, a competição acabará dominada por agentes de IA.
Eu achava que no code golf demoraria mais, porque os dados de treino são escassos. É uma área mais de nicho. Mas até lá a IA está começando a se equiparar a humanos especialistas. Golf é meu tipo favorito de puzzle de programação, então isso é triste.
É realmente impressionante o quanto a capacidade de resolução de problemas da IA avançou
https://en.wikipedia.org/wiki/Capture_the_flag_(cybersecurit...
Ainda não menciona IA, mas, se a IA continuar dominando cada vez mais as competições, é bem provável que isso mude em breve
- Usar IA em CTF é como usar um carro para tentar ser bom em corrida de 100 jardas
Não é algo exclusivo de CTF. Acredito fortemente que, em game jams como Ludum Dare ou em hackathons, o papel do programador na prática acabou
No mundo da programação competitiva sempre houve torneios presenciais, e depois da IA a importância deles aumentou ainda mais. Na verdade, já eram mais justos mesmo antes. Se CTF quiser sobreviver, provavelmente terá de adotar essa estratégia.
Indo além, também é possível permitir tudo o que já estiver no computador, mas nada além disso. Por exemplo, algumas competições de programação permitem material em papel sem limites. No CTF, seria preciso muito mais do que isso, então materiais eletrônicos provavelmente seriam necessários

A IA de fronteira quebrou o formato dos CTFs públicos

O placar dos CTFs online públicos mudou

O contexto da mudança

Experiência com CTF e a inquietação

A primeira mudança após o GPT-4

A mudança de formato provocada pelo Claude Opus 4.5

A mudança decisiva após o GPT-5.5

O dano ao caminho de aprendizado dos iniciantes

O placar era uma escada de aprendizado

Diferença entre CTF para iniciantes e plataformas de aprendizado

O limite do contra-argumento “CTF não morreu”

Pesquisa em segurança e CTF competitivo não são a mesma coisa

O problema da analogia com engines de xadrez

Por que é difícil para os organizadores reagirem

A lacuna no “é só se adaptar”

O impacto no cenário atual de CTF

O que precisa permanecer daqui para frente

Leituras relacionadas

1 comentários

Comentários do Hacker News