Mapa da trilha
Conteúdo detalhado
🤖 Criando subagentes nos dois
Anatomia de um subagent, Claude Markdown vs Codex TOML, invocação automática vs spawn explícito, max_threads e max_depth.
Sub-agente é uma sessão filha com context próprio. Recebe prompt da sessão pai, faz o trabalho, retorna SÓ a resposta final. O context da varredura não polui o pai.
É o mecanismo central de auditoria, limpeza e tarefas pesadas sem queimar o context principal.
Fresh context · parent→child one-way · output synthesis · context economy.
Arquivo em `.claude/agents/nome-do-agent.md`. YAML frontmatter com `name`, `description`, `tools`. Corpo markdown vira o system prompt. Comando `/agents` cria interativamente.
É legível como documentação. Outro humano abre o arquivo e entende imediatamente o que o agent faz.
YAML frontmatter · /agents command · markdown body como system prompt · descrição triggera invocação.
Arquivo `.toml` com `developer_instructions` como campo explícito. Campos opcionais: `model`, `model_reasoning_effort`, `sandbox_mode`, `mcp_servers`, `nickname_candidates`. Personal: `~/.codex/agents/`. Projeto: `.codex/agents/`.
TOML te dá controle granular: modelo diferente por agent, sandbox diferente, MCPs específicos. Mais poder, mais responsabilidade.
developer_instructions · sandbox_mode · model override · MCP per-agent · personal vs project.
Claude: agente principal decide invocar o subagent baseado no description. Codex: subagent só roda se você escrever literalmente `spawn`. Controle ou conveniência — escolha.
Em Codex você não pode esquecer o spawn. Em Claude você não pode esquecer de escrever description triggante.
Trigger por description · spawn command · controle vs delegação · descobertabilidade.
Codex padrão: `agents.max_threads = 6` (até 6 sub-agents paralelos) e `agents.max_depth = 1` (subagent não pode criar subsubagent). Configurável em `config.toml`.
Saber o teto evita designs que dependem de recursão profunda. No Claude esses limites não são tão documentados — Codex te força a planejar.
Limites duros · recursão proibida · paralelismo até 6 · planejamento de fan-out.
Os melhores subagents têm: 1 trabalho claro, surface de tools que só atende a esse trabalho, instruções que limitam drift, output schema previsível (ex: "retorne lista de até 20 itens").
Subagent genérico vira preguiça do pai e gasta token. Narrow vira alavanca de verdade.
Single responsibility · tool surface · output schema · anti-drift.
⚖️ Forças, limitações e quando usar cada um
Codex sandbox kernel · 2-3× menos tokens · lidera Terminal-Bench · fraco em frontend. Claude SWE-bench 80,8% · hooks programáveis · rate-limit · mais caro.
Codex bloqueia no kernel: syscall negado, modelo não escapa. Claude valida no app-layer: hook intercepta comando, roda lint/regra/policy. Modelos diferentes pra ameaças diferentes.
Auditar código suspeito? Codex sandbox. Rodar seu próprio código com regras de equipe? Claude hooks.
Threat model · adversário potencial vs benigno-overconfident · enforcement levels.
Codex usa 2-3× menos tokens pra resultado comparável. Retorna em segundos onde Claude leva dezenas de segundos. Em ciclos rápidos isso compõe muito.
Tarefa rápida e repetitiva (script, refactor pequeno, debug) → Codex. Decisão arquitetural densa → Claude.
Token efficiency · iteration speed · custo composto · time-to-first-result.
Claude Code (Opus 4.6): 80,8% em SWE-bench Verified (campeão). Codex CLI: lidera Terminal-Bench 2.0 por 12 pontos sobre Claude. Skills complementares — não rivais.
SWE-bench = refator longo, contexto profundo. Terminal-Bench = shell, DevOps, automação. Saber qual rege qual task.
SWE-bench Verified · Terminal-Bench 2.0 · campos de força · escolha guiada por benchmark.
Codex: frontend é fraco, sessões longas viram erráticas, sandbox kernel pode bloquear workflow legítimo (network). Claude: rate-limit (reclamação #1 r/ClaudeCode), 4× mais caro em tokens, terminal-bench 12pts atrás.
Ninguém vende dois agentes. Saber a fraqueza de cada um te dá o critério de decisão real.
Honest limitations · rate-limit · session erraticity · binary sandbox.
Refator profundo → Claude. Script shell rápido → Codex. Frontend complex → Claude. Auditoria sandboxed de código suspeito → Codex. Onboarding em repo novo → Claude. Tarefa em batch paralelo (até 6) → Codex.
Decisão na hora vira reflexo. Sem reflexo, você usa o agente "padrão" e perde performance.
Decision table · task taxonomy · reflexo treinado · agent-task fit.
A literatura de 2026 (DataCamp, Termdock, blakecrosley) converge: melhores resultados vêm de combinar os dois. Codex pra delegação cloud-sandboxed, Claude pra governance e refator de horizonte longo.
Confirma a tese do curso. Combinar = mais que somatório das forças individuais.
Synergy · 1+1 > 2 · documented pattern · best of both.
🧹 Limpando sessão e auditando com subagentes
Context rot é o verdadeiro vilão. /clear vs /compact vs /usage. Delegar auditoria pra subagent fresh. Não vire o lixão de 1M tokens.
A maioria das sessões ruins NÃO é modelo fraco — é contexto errado carregado por tempo demais. Tentativas falhadas, paths obsoletos, info desatualizada poluem o raciocínio.
Reconhecer rot = reconhecer que limpar > insistir. É contraintuitivo mas é o reflexo profissional.
Context rot · stale content · noise accumulation · clean-and-restart.
`/compact`: modelo resume e substitui o histórico pela síntese. `/clear`: você decide o que importa e começa limpo. Compact é cômodo. Clear é deliberado.
Clear dá contexto exato que você quer. Compact preserva o que a IA julgou importante (pode errar). Use clear quando você sabe o estado.
Deliberate cleanup · AI summary · trade-off cômodo vs precisão.
Comando novo (2026): mostra consumo de tokens da sessão atual em tempo real. Rode antes de task grande pra decidir se precisa de `/compact` ou pode continuar.
Sem `/usage` você descobre o limite quando o modelo trava. Com `/usage` você antecipa.
Token visibility · proactive cleanup · session budget · live measurement.
Em vez de auditar inline (flooda o context principal), spawn subagent. Ele varre 50 arquivos, devolve resumo de 20 linhas. Context principal: 20 linhas em vez de 5.000.
É o uso #1 mais lucrativo de subagent. Auditoria de API endpoints, de skills duplicadas, de dead code — tudo via subagent.
Context isolation · output budget · audit pattern · cost-effective delegation.
Claude 1M context não convida a guardar tudo. Convida a planejar: o que VALE estar no context. Carregar 50 arquivos "por garantia" piora a qualidade da resposta.
Mais context ≠ melhor decisão. Curadoria de context vence quantidade.
Curated context · signal-to-noise · 1M anti-pattern · purposeful loading.
Codex tem worker explícito (write-enabled execution role). Claude tem Plan subagent dedicado à fase de planejamento. Codex organiza por unidade de execução, Claude por fase de pensamento.
Quando você quer EXECUÇÃO paralela em batch → Codex worker. Quando você quer PLANO depois execução → Claude Plan.
Execution role vs thinking role · worker pattern · plan pattern · paradigm split.
🪢 Worktrees + 2 terminais em paralelo
Git worktree isolando node_modules e cache. Claude num worktree, Codex no outro. Filosofia das 3 camadas pra qualquer agente futuro.
`git worktree add ../proj-feature feature-branch` cria uma pasta paralela com a branch. Cada worktree tem seus próprios `node_modules`, build cache, pytest cache.
Sem worktree, trocar de branch invalida cache. Com worktree, dois agentes trabalham em branches diferentes sem se atropelar.
git worktree · cache isolation · branch isolation · paralelismo de fato.
Setup mais simples: dois terminais (`claude` num, `codex` no outro) no MESMO diretório. Funciona pra tasks em arquivos diferentes. Para arquivos compartilhados: overwrite risk.
É o setup que o Nate Herk usa no vídeo. Simples, funciona pra 80% dos casos, sem complicação.
Dual terminal · same workdir · file-level coordination · overwrite risk.
Regra: cada agente tem ARQUIVOS designados. Antes de qualquer edição de arquivo "do outro", commit do trabalho atual + comunicar via HANDOVER.md.
É o erro mais caro — Claude salva, Codex salva por cima, perde trabalho. Disciplina vence.
File ownership · pre-edit commit · communication protocol · disciplined collaboration.
Claude desenha dark mode bonito. Codex restaura valor que se perdeu no styling. Cada um atacando seu forte. Output: HTML que nenhum dos dois faria sozinho.
É o uso mais avançado e o mais lucrativo. Forças complementares geram saída melhor que a melhor das duas isoladas.
Complementary strengths · stylist role · restorer role · emergent quality.
Camada 1: Shared Knowledge (docs, ref, reading material — qualquer agente lê). Camada 2: Workflows/Skills (SKILL.md universal). Camada 3: Tool-specific Config (.claude/settings.json vs .codex/config.toml).
É o modelo mental que carrega o curso inteiro. Se você organizar projeto novo nessas 3 camadas, qualquer agente futuro entra fácil.
3-layer model · separation of concerns · future-proof project layout · agnostic architecture.
Em 2026 já temos: Codex, Claude Code, Gemini CLI, Cursor, Windsurf, Continue, Amp, Warp, Goose, Devin. Em 2027 virá mais. Quem organizou nas 3 camadas adapta em horas, não semanas.
O curso não é sobre Codex+Claude. É sobre ser agnostic. O conceito vale pro próximo que vier.
Future-proof · agnostic mindset · 10+ agents already · adaptive playbook.