gstack - a equipe de engenharia virtual criada com Claude Code

xguru · 2026-03-23T10:06:01+09:00

A fábrica de software open source composta por IA, criada e usada pelo CEO da YC, Garry Tan, foi estruturada para que uma pessoa trabalhe como se fosse uma equipe de 20 pessoas É composta por comandos slash que cobrem todo o sprint na sequência Think → Plan → Build → Review → Test → Ship → Reflect, e cada skill transmite automaticamente o contexto para a próxima skill Começa com /office-hours para validar hipóteses do produto, define a arquitetura com /plan-ceo-review · /plan-eng-review e depois automatiza desde correções de bugs até a criação de PR com /review · /qa · /ship Cada comando atua como um especialista por função: revisão de CEO, projeto de gerente de engenharia, supervisão de designer, líder de QA, engenheiro de release etc. Usuários-alvo Founder·CEO — fundadores técnicos que ainda querem fazer deploy do próprio código Iniciantes no Claude Code — usuários que precisam de um fluxo de trabalho estruturado e baseado em papéis em vez de um prompt em branco Tech Lead·Staff Engineer — engenheiros sêniores que precisam de revisão rigorosa, QA e automação de release em cada PR As skills que são o núcleo do sprint /office-hours — valida hipóteses do produto com 6 perguntas obrigatórias no formato de office hours da YC, gera um documento de design e o repassa automaticamente para as skills seguintes /plan-ceo-review — redefine o problema e explora um "produto 10 estrelas"; 4 modos: Expansion, Selective Expansion, Hold Scope e Reduction /plan-eng-review — define arquitetura, fluxo de dados, diagramas ASCII, edge cases, matriz de testes e preocupações de segurança /plan-design-review — avalia cada dimensão do design de 0 a 10 e explica o padrão nota 10; inclui detecção de AI Slop e faz 1 interação AskUserQuestion para cada decisão de design /design-consultation — constrói um sistema de design completo do zero e gera mockups realistas do produto /review — detecta bugs que passam no CI mas quebram em produção, corrige automaticamente problemas óbvios e sinaliza lacunas de acabamento /investigate — princípio rígido: sem investigação, sem correção; rastreia fluxo de dados, valida hipóteses e interrompe após 3 falhas /design-review — após a mesma auditoria de /plan-design-review, corrige diretamente os problemas encontrados e anexa capturas de tela de antes/depois /qa — testa o app em um navegador real, encontra e corrige bugs e gera automaticamente testes de regressão para cada correção /qa-only — mesma metodologia de /qa, mas gera apenas relatórios de bugs sem alterar código /cso — auditoria com modelo de ameaças OWASP Top 10 + STRIDE; 17 regras para excluir falsos positivos, gate de confiança de 8/10 ou mais e cenário de exploit específico para cada achado /ship — sincroniza com main, executa testes, audita cobertura, faz push e cria PR; se não houver framework de testes, faz bootstrap automaticamente /land-and-deploy — conclui em um único comando: merge do PR → espera por CI·deploy → validação do estado em produção /canary — loop de monitoramento pós-deploy para erros de console, regressões de performance e falhas de página /benchmark — mede baseline de tempo de carregamento, Core Web Vitals e tamanho de recursos, e compara antes/depois por PR /document-release — atualiza toda a documentação do projeto de acordo com o que foi deployado e detecta automaticamente READMEs desatualizados /retro — retrospectiva semanal; análise por pessoa, histórico contínuo de deploys, tendência de saúde dos testes e, com /retro global, retrospectiva integrada do projeto inteiro e de ferramentas de IA (Claude Code, Codex, Gemini) /browse — navegador Chromium real, cliques reais, capturas de tela reais, cerca de 100 ms por comando /setup-browser-cookies — importa cookies do Chrome·Arc·Brave·Edge para uma sessão headless e testa páginas autenticadas /autoplan — executa automaticamente, em sequência, as revisões de CEO → design → engenharia, expondo ao usuário apenas as decisões de preferência Power tools /codex — revisão de código independente com OpenAI Codex CLI; 3 modos: revisão (gate de pass/fail), desafio adversarial e consultoria aberta; ao executar /review e /codex juntos, faz análise cruzada entre modelos /careful — avisa antes de executar comandos destrutivos como rm -rf, DROP TABLE e force push; é ativado ao digitar "be careful" /freeze — restringe a edição de arquivos a um diretório específico, evitando alterações fora do escopo durante debugging /guard — integra /careful + /freeze, a configuração máxima de segurança para trabalho em produção /unfreeze — remove os limites de /freeze /setup-deploy — configuração única para /land-and-deploy, com detecção automática de plataforma, URL de produção e comando de deploy /gstack-upgrade — atualiza o gstack para a versão mais recente, detectando e sincronizando instalações globais e vendorizadas Sprint paralelo: por meio do Conductor, é possível executar várias sessões do Claude Code ao mesmo tempo em workspaces isolados Ex.: uma sessão com /office-hours, outra com /review, uma terceira implementando funcionalidade e uma quarta com /qa, tudo em paralelo — Fundadores, engenheiros líderes e PMs podem fazer fork da fábrica de desenvolvimento com IA e experimentar ou expandi-la diretamente Além do Claude Code, funciona em todos os agentes que suportam o padrão SKILL.md, como Codex, Gemini CLI, Cursor Licença MIT

(github.com/garrytan)

94 pontos por xguru 2026-03-23 | 4 comentários | Compartilhar no WhatsApp

A fábrica de software open source composta por IA, criada e usada pelo CEO da YC, Garry Tan, foi estruturada para que uma pessoa trabalhe como se fosse uma equipe de 20 pessoas
É composta por comandos slash que cobrem todo o sprint na sequência Think → Plan → Build → Review → Test → Ship → Reflect, e cada skill transmite automaticamente o contexto para a próxima skill
Começa com /office-hours para validar hipóteses do produto, define a arquitetura com /plan-ceo-review · /plan-eng-review e depois automatiza desde correções de bugs até a criação de PR com /review · /qa · /ship
Cada comando atua como um especialista por função: revisão de CEO, projeto de gerente de engenharia, supervisão de designer, líder de QA, engenheiro de release etc.
Usuários-alvo
- Founder·CEO — fundadores técnicos que ainda querem fazer deploy do próprio código
- Iniciantes no Claude Code — usuários que precisam de um fluxo de trabalho estruturado e baseado em papéis em vez de um prompt em branco
- Tech Lead·Staff Engineer — engenheiros sêniores que precisam de revisão rigorosa, QA e automação de release em cada PR
As skills que são o núcleo do sprint
- /office-hours — valida hipóteses do produto com 6 perguntas obrigatórias no formato de office hours da YC, gera um documento de design e o repassa automaticamente para as skills seguintes
- /plan-ceo-review — redefine o problema e explora um "produto 10 estrelas"; 4 modos: Expansion, Selective Expansion, Hold Scope e Reduction
- /plan-eng-review — define arquitetura, fluxo de dados, diagramas ASCII, edge cases, matriz de testes e preocupações de segurança
- /plan-design-review — avalia cada dimensão do design de 0 a 10 e explica o padrão nota 10; inclui detecção de AI Slop e faz 1 interação AskUserQuestion para cada decisão de design
- /design-consultation — constrói um sistema de design completo do zero e gera mockups realistas do produto
- /review — detecta bugs que passam no CI mas quebram em produção, corrige automaticamente problemas óbvios e sinaliza lacunas de acabamento
- /investigate — princípio rígido: sem investigação, sem correção; rastreia fluxo de dados, valida hipóteses e interrompe após 3 falhas
- /design-review — após a mesma auditoria de /plan-design-review, corrige diretamente os problemas encontrados e anexa capturas de tela de antes/depois
- /qa — testa o app em um navegador real, encontra e corrige bugs e gera automaticamente testes de regressão para cada correção
- /qa-only — mesma metodologia de /qa, mas gera apenas relatórios de bugs sem alterar código
- /cso — auditoria com modelo de ameaças OWASP Top 10 + STRIDE; 17 regras para excluir falsos positivos, gate de confiança de 8/10 ou mais e cenário de exploit específico para cada achado
- /ship — sincroniza com main, executa testes, audita cobertura, faz push e cria PR; se não houver framework de testes, faz bootstrap automaticamente
- /land-and-deploy — conclui em um único comando: merge do PR → espera por CI·deploy → validação do estado em produção
- /canary — loop de monitoramento pós-deploy para erros de console, regressões de performance e falhas de página
- /benchmark — mede baseline de tempo de carregamento, Core Web Vitals e tamanho de recursos, e compara antes/depois por PR
- /document-release — atualiza toda a documentação do projeto de acordo com o que foi deployado e detecta automaticamente READMEs desatualizados
- /retro — retrospectiva semanal; análise por pessoa, histórico contínuo de deploys, tendência de saúde dos testes e, com /retro global, retrospectiva integrada do projeto inteiro e de ferramentas de IA (Claude Code, Codex, Gemini)
- /browse — navegador Chromium real, cliques reais, capturas de tela reais, cerca de 100 ms por comando
- /setup-browser-cookies — importa cookies do Chrome·Arc·Brave·Edge para uma sessão headless e testa páginas autenticadas
- /autoplan — executa automaticamente, em sequência, as revisões de CEO → design → engenharia, expondo ao usuário apenas as decisões de preferência
Power tools
- /codex — revisão de código independente com OpenAI Codex CLI; 3 modos: revisão (gate de pass/fail), desafio adversarial e consultoria aberta; ao executar /review e /codex juntos, faz análise cruzada entre modelos
- /careful — avisa antes de executar comandos destrutivos como rm -rf, DROP TABLE e force push; é ativado ao digitar "be careful"
- /freeze — restringe a edição de arquivos a um diretório específico, evitando alterações fora do escopo durante debugging
- /guard — integra /careful + /freeze, a configuração máxima de segurança para trabalho em produção
- /unfreeze — remove os limites de /freeze
- /setup-deploy — configuração única para /land-and-deploy, com detecção automática de plataforma, URL de produção e comando de deploy
- /gstack-upgrade — atualiza o gstack para a versão mais recente, detectando e sincronizando instalações globais e vendorizadas
Sprint paralelo: por meio do Conductor, é possível executar várias sessões do Claude Code ao mesmo tempo em workspaces isolados
- Ex.: uma sessão com /office-hours, outra com /review, uma terceira implementando funcionalidade e uma quarta com /qa, tudo em paralelo
  — Fundadores, engenheiros líderes e PMs podem fazer fork da fábrica de desenvolvimento com IA e experimentar ou expandi-la diretamente
Além do Claude Code, funciona em todos os agentes que suportam o padrão SKILL.md, como Codex, Gemini CLI, Cursor
Licença MIT

4 comentários

kgcrom 2026-03-23

Uau!! O Garry Tan retuitou o GeekNews.
https://x.com/garrytan/status/2035898375934300353

laeyoung 2026-03-25

Como o Office Hour estava demorando bastante, fui dar uma olhada e percebi que só este skill já tem um markdown absurdamente longo.

angrybird0 2026-03-23

Parece que está evoluindo para que cada vez mais pessoas que tocam negócios de uma pessoa só consigam aproveitar bem.

ragingwind 2026-03-23

As office-hours são divertidas; eu também gosto de colocar a mão na massa.

gstack - a equipe de engenharia virtual criada com Claude Code

Leituras relacionadas

4 comentários