- A fábrica de software open source composta por IA, criada e usada pelo CEO da YC, Garry Tan, foi estruturada para que uma pessoa trabalhe como se fosse uma equipe de 20 pessoas
- É composta por comandos slash que cobrem todo o sprint na sequência Think → Plan → Build → Review → Test → Ship → Reflect, e cada skill transmite automaticamente o contexto para a próxima skill
- Começa com
/office-hours para validar hipóteses do produto, define a arquitetura com /plan-ceo-review · /plan-eng-review e depois automatiza desde correções de bugs até a criação de PR com /review · /qa · /ship
- Cada comando atua como um especialista por função: revisão de CEO, projeto de gerente de engenharia, supervisão de designer, líder de QA, engenheiro de release etc.
- Usuários-alvo
- Founder·CEO — fundadores técnicos que ainda querem fazer deploy do próprio código
- Iniciantes no Claude Code — usuários que precisam de um fluxo de trabalho estruturado e baseado em papéis em vez de um prompt em branco
- Tech Lead·Staff Engineer — engenheiros sêniores que precisam de revisão rigorosa, QA e automação de release em cada PR
- As skills que são o núcleo do sprint
/office-hours — valida hipóteses do produto com 6 perguntas obrigatórias no formato de office hours da YC, gera um documento de design e o repassa automaticamente para as skills seguintes
/plan-ceo-review — redefine o problema e explora um "produto 10 estrelas"; 4 modos: Expansion, Selective Expansion, Hold Scope e Reduction
/plan-eng-review — define arquitetura, fluxo de dados, diagramas ASCII, edge cases, matriz de testes e preocupações de segurança
/plan-design-review — avalia cada dimensão do design de 0 a 10 e explica o padrão nota 10; inclui detecção de AI Slop e faz 1 interação AskUserQuestion para cada decisão de design
/design-consultation — constrói um sistema de design completo do zero e gera mockups realistas do produto
/review — detecta bugs que passam no CI mas quebram em produção, corrige automaticamente problemas óbvios e sinaliza lacunas de acabamento
/investigate — princípio rígido: sem investigação, sem correção; rastreia fluxo de dados, valida hipóteses e interrompe após 3 falhas
/design-review — após a mesma auditoria de /plan-design-review, corrige diretamente os problemas encontrados e anexa capturas de tela de antes/depois
/qa — testa o app em um navegador real, encontra e corrige bugs e gera automaticamente testes de regressão para cada correção
/qa-only — mesma metodologia de /qa, mas gera apenas relatórios de bugs sem alterar código
/cso — auditoria com modelo de ameaças OWASP Top 10 + STRIDE; 17 regras para excluir falsos positivos, gate de confiança de 8/10 ou mais e cenário de exploit específico para cada achado
/ship — sincroniza com main, executa testes, audita cobertura, faz push e cria PR; se não houver framework de testes, faz bootstrap automaticamente
/land-and-deploy — conclui em um único comando: merge do PR → espera por CI·deploy → validação do estado em produção
/canary — loop de monitoramento pós-deploy para erros de console, regressões de performance e falhas de página
/benchmark — mede baseline de tempo de carregamento, Core Web Vitals e tamanho de recursos, e compara antes/depois por PR
/document-release — atualiza toda a documentação do projeto de acordo com o que foi deployado e detecta automaticamente READMEs desatualizados
/retro — retrospectiva semanal; análise por pessoa, histórico contínuo de deploys, tendência de saúde dos testes e, com /retro global, retrospectiva integrada do projeto inteiro e de ferramentas de IA (Claude Code, Codex, Gemini)
/browse — navegador Chromium real, cliques reais, capturas de tela reais, cerca de 100 ms por comando
/setup-browser-cookies — importa cookies do Chrome·Arc·Brave·Edge para uma sessão headless e testa páginas autenticadas
/autoplan — executa automaticamente, em sequência, as revisões de CEO → design → engenharia, expondo ao usuário apenas as decisões de preferência
- Power tools
/codex — revisão de código independente com OpenAI Codex CLI; 3 modos: revisão (gate de pass/fail), desafio adversarial e consultoria aberta; ao executar /review e /codex juntos, faz análise cruzada entre modelos
/careful — avisa antes de executar comandos destrutivos como rm -rf, DROP TABLE e force push; é ativado ao digitar "be careful"
/freeze — restringe a edição de arquivos a um diretório específico, evitando alterações fora do escopo durante debugging
/guard — integra /careful + /freeze, a configuração máxima de segurança para trabalho em produção
/unfreeze — remove os limites de /freeze
/setup-deploy — configuração única para /land-and-deploy, com detecção automática de plataforma, URL de produção e comando de deploy
/gstack-upgrade — atualiza o gstack para a versão mais recente, detectando e sincronizando instalações globais e vendorizadas
- Sprint paralelo: por meio do Conductor, é possível executar várias sessões do Claude Code ao mesmo tempo em workspaces isolados
- Ex.: uma sessão com
/office-hours, outra com /review, uma terceira implementando funcionalidade e uma quarta com /qa, tudo em paralelo
— Fundadores, engenheiros líderes e PMs podem fazer fork da fábrica de desenvolvimento com IA e experimentar ou expandi-la diretamente
- Além do Claude Code, funciona em todos os agentes que suportam o padrão SKILL.md, como Codex, Gemini CLI, Cursor
- Licença MIT
4 comentários
Uau!! O Garry Tan retuitou o GeekNews.
https://x.com/garrytan/status/2035898375934300353
Como o Office Hour estava demorando bastante, fui dar uma olhada e percebi que só este skill já tem um markdown absurdamente longo.
Parece que está evoluindo para que cada vez mais pessoas que tocam negócios de uma pessoa só consigam aproveitar bem.
As office-hours são divertidas; eu também gosto de colocar a mão na massa.