T3 Avançado | Tool-Agnostic AI Coding

Mapa da trilha

Conteúdo detalhado

3.1~40 min

🤖 Criando subagentes nos dois

Anatomia de um subagent, Claude Markdown vs Codex TOML, invocação automática vs spawn explícito, max_threads e max_depth.

O que é:

Sub-agente é uma sessão filha com context próprio. Recebe prompt da sessão pai, faz o trabalho, retorna SÓ a resposta final. O context da varredura não polui o pai.

Por que aprender:

É o mecanismo central de auditoria, limpeza e tarefas pesadas sem queimar o context principal.

Conceitos-chave:

Fresh context · parent→child one-way · output synthesis · context economy.

O que é:

Arquivo em `.claude/agents/nome-do-agent.md`. YAML frontmatter com `name`, `description`, `tools`. Corpo markdown vira o system prompt. Comando `/agents` cria interativamente.

Por que aprender:

É legível como documentação. Outro humano abre o arquivo e entende imediatamente o que o agent faz.

Conceitos-chave:

YAML frontmatter · /agents command · markdown body como system prompt · descrição triggera invocação.

O que é:

Arquivo `.toml` com `developer_instructions` como campo explícito. Campos opcionais: `model`, `model_reasoning_effort`, `sandbox_mode`, `mcp_servers`, `nickname_candidates`. Personal: `~/.codex/agents/`. Projeto: `.codex/agents/`.

Por que aprender:

TOML te dá controle granular: modelo diferente por agent, sandbox diferente, MCPs específicos. Mais poder, mais responsabilidade.

Conceitos-chave:

developer_instructions · sandbox_mode · model override · MCP per-agent · personal vs project.

O que é:

Claude: agente principal decide invocar o subagent baseado no description. Codex: subagent só roda se você escrever literalmente `spawn`. Controle ou conveniência — escolha.

Por que aprender:

Em Codex você não pode esquecer o spawn. Em Claude você não pode esquecer de escrever description triggante.

Conceitos-chave:

Trigger por description · spawn command · controle vs delegação · descobertabilidade.

O que é:

Codex padrão: `agents.max_threads = 6` (até 6 sub-agents paralelos) e `agents.max_depth = 1` (subagent não pode criar subsubagent). Configurável em `config.toml`.

Por que aprender:

Saber o teto evita designs que dependem de recursão profunda. No Claude esses limites não são tão documentados — Codex te força a planejar.

Conceitos-chave:

Limites duros · recursão proibida · paralelismo até 6 · planejamento de fan-out.

O que é:

Os melhores subagents têm: 1 trabalho claro, surface de tools que só atende a esse trabalho, instruções que limitam drift, output schema previsível (ex: "retorne lista de até 20 itens").

Por que aprender:

Subagent genérico vira preguiça do pai e gasta token. Narrow vira alavanca de verdade.

Conceitos-chave:

Single responsibility · tool surface · output schema · anti-drift.

Ver Completo

3.2~35 min

⚖️ Forças, limitações e quando usar cada um

Codex sandbox kernel · 2-3× menos tokens · lidera Terminal-Bench · fraco em frontend. Claude SWE-bench 80,8% · hooks programáveis · rate-limit · mais caro.

O que é:

Codex bloqueia no kernel: syscall negado, modelo não escapa. Claude valida no app-layer: hook intercepta comando, roda lint/regra/policy. Modelos diferentes pra ameaças diferentes.

Por que aprender:

Auditar código suspeito? Codex sandbox. Rodar seu próprio código com regras de equipe? Claude hooks.

Conceitos-chave:

Threat model · adversário potencial vs benigno-overconfident · enforcement levels.

O que é:

Codex usa 2-3× menos tokens pra resultado comparável. Retorna em segundos onde Claude leva dezenas de segundos. Em ciclos rápidos isso compõe muito.

Por que aprender:

Tarefa rápida e repetitiva (script, refactor pequeno, debug) → Codex. Decisão arquitetural densa → Claude.

Conceitos-chave:

Token efficiency · iteration speed · custo composto · time-to-first-result.

O que é:

Claude Code (Opus 4.6): 80,8% em SWE-bench Verified (campeão). Codex CLI: lidera Terminal-Bench 2.0 por 12 pontos sobre Claude. Skills complementares — não rivais.

Por que aprender:

SWE-bench = refator longo, contexto profundo. Terminal-Bench = shell, DevOps, automação. Saber qual rege qual task.

Conceitos-chave:

SWE-bench Verified · Terminal-Bench 2.0 · campos de força · escolha guiada por benchmark.

O que é:

Codex: frontend é fraco, sessões longas viram erráticas, sandbox kernel pode bloquear workflow legítimo (network). Claude: rate-limit (reclamação #1 r/ClaudeCode), 4× mais caro em tokens, terminal-bench 12pts atrás.

Por que aprender:

Ninguém vende dois agentes. Saber a fraqueza de cada um te dá o critério de decisão real.

Conceitos-chave:

Honest limitations · rate-limit · session erraticity · binary sandbox.

O que é:

Refator profundo → Claude. Script shell rápido → Codex. Frontend complex → Claude. Auditoria sandboxed de código suspeito → Codex. Onboarding em repo novo → Claude. Tarefa em batch paralelo (até 6) → Codex.

Por que aprender:

Decisão na hora vira reflexo. Sem reflexo, você usa o agente "padrão" e perde performance.

Conceitos-chave:

Decision table · task taxonomy · reflexo treinado · agent-task fit.

O que é:

A literatura de 2026 (DataCamp, Termdock, blakecrosley) converge: melhores resultados vêm de combinar os dois. Codex pra delegação cloud-sandboxed, Claude pra governance e refator de horizonte longo.

Por que aprender:

Confirma a tese do curso. Combinar = mais que somatório das forças individuais.

Conceitos-chave:

Synergy · 1+1 > 2 · documented pattern · best of both.

Ver Completo

3.3~35 min

🧹 Limpando sessão e auditando com subagentes

Context rot é o verdadeiro vilão. /clear vs /compact vs /usage. Delegar auditoria pra subagent fresh. Não vire o lixão de 1M tokens.

O que é:

A maioria das sessões ruins NÃO é modelo fraco — é contexto errado carregado por tempo demais. Tentativas falhadas, paths obsoletos, info desatualizada poluem o raciocínio.

Por que aprender:

Reconhecer rot = reconhecer que limpar > insistir. É contraintuitivo mas é o reflexo profissional.

Conceitos-chave:

Context rot · stale content · noise accumulation · clean-and-restart.

O que é:

`/compact`: modelo resume e substitui o histórico pela síntese. `/clear`: você decide o que importa e começa limpo. Compact é cômodo. Clear é deliberado.

Por que aprender:

Clear dá contexto exato que você quer. Compact preserva o que a IA julgou importante (pode errar). Use clear quando você sabe o estado.

Conceitos-chave:

Deliberate cleanup · AI summary · trade-off cômodo vs precisão.

O que é:

Comando novo (2026): mostra consumo de tokens da sessão atual em tempo real. Rode antes de task grande pra decidir se precisa de `/compact` ou pode continuar.

Por que aprender:

Sem `/usage` você descobre o limite quando o modelo trava. Com `/usage` você antecipa.

Conceitos-chave:

Token visibility · proactive cleanup · session budget · live measurement.

O que é:

Em vez de auditar inline (flooda o context principal), spawn subagent. Ele varre 50 arquivos, devolve resumo de 20 linhas. Context principal: 20 linhas em vez de 5.000.

Por que aprender:

É o uso #1 mais lucrativo de subagent. Auditoria de API endpoints, de skills duplicadas, de dead code — tudo via subagent.

Conceitos-chave:

Context isolation · output budget · audit pattern · cost-effective delegation.

O que é:

Claude 1M context não convida a guardar tudo. Convida a planejar: o que VALE estar no context. Carregar 50 arquivos "por garantia" piora a qualidade da resposta.

Por que aprender:

Mais context ≠ melhor decisão. Curadoria de context vence quantidade.

Conceitos-chave:

Curated context · signal-to-noise · 1M anti-pattern · purposeful loading.

O que é:

Codex tem worker explícito (write-enabled execution role). Claude tem Plan subagent dedicado à fase de planejamento. Codex organiza por unidade de execução, Claude por fase de pensamento.

Por que aprender:

Quando você quer EXECUÇÃO paralela em batch → Codex worker. Quando você quer PLANO depois execução → Claude Plan.

Conceitos-chave:

Execution role vs thinking role · worker pattern · plan pattern · paradigm split.

Ver Completo

3.4~30 min

🪢 Worktrees + 2 terminais em paralelo

Git worktree isolando node_modules e cache. Claude num worktree, Codex no outro. Filosofia das 3 camadas pra qualquer agente futuro.

O que é:

`git worktree add ../proj-feature feature-branch` cria uma pasta paralela com a branch. Cada worktree tem seus próprios `node_modules`, build cache, pytest cache.

Por que aprender:

Sem worktree, trocar de branch invalida cache. Com worktree, dois agentes trabalham em branches diferentes sem se atropelar.

Conceitos-chave:

git worktree · cache isolation · branch isolation · paralelismo de fato.

O que é:

Setup mais simples: dois terminais (`claude` num, `codex` no outro) no MESMO diretório. Funciona pra tasks em arquivos diferentes. Para arquivos compartilhados: overwrite risk.

Por que aprender:

É o setup que o Nate Herk usa no vídeo. Simples, funciona pra 80% dos casos, sem complicação.

Conceitos-chave:

Dual terminal · same workdir · file-level coordination · overwrite risk.

O que é:

Regra: cada agente tem ARQUIVOS designados. Antes de qualquer edição de arquivo "do outro", commit do trabalho atual + comunicar via HANDOVER.md.

Por que aprender:

É o erro mais caro — Claude salva, Codex salva por cima, perde trabalho. Disciplina vence.

Conceitos-chave:

File ownership · pre-edit commit · communication protocol · disciplined collaboration.

O que é:

Claude desenha dark mode bonito. Codex restaura valor que se perdeu no styling. Cada um atacando seu forte. Output: HTML que nenhum dos dois faria sozinho.

Por que aprender:

É o uso mais avançado e o mais lucrativo. Forças complementares geram saída melhor que a melhor das duas isoladas.

Conceitos-chave:

Complementary strengths · stylist role · restorer role · emergent quality.

O que é:

Camada 1: Shared Knowledge (docs, ref, reading material — qualquer agente lê). Camada 2: Workflows/Skills (SKILL.md universal). Camada 3: Tool-specific Config (.claude/settings.json vs .codex/config.toml).

Por que aprender:

É o modelo mental que carrega o curso inteiro. Se você organizar projeto novo nessas 3 camadas, qualquer agente futuro entra fácil.

Conceitos-chave:

3-layer model · separation of concerns · future-proof project layout · agnostic architecture.

O que é:

Em 2026 já temos: Codex, Claude Code, Gemini CLI, Cursor, Windsurf, Continue, Amp, Warp, Goose, Devin. Em 2027 virá mais. Quem organizou nas 3 camadas adapta em horas, não semanas.

Por que aprender:

O curso não é sobre Codex+Claude. É sobre ser agnostic. O conceito vale pro próximo que vier.

Conceitos-chave:

Future-proof · agnostic mindset · 10+ agents already · adaptive playbook.

Ver Completo

← Trilha anterior Voltar ao início ★

🪢 Avançado

Mapa da trilha

🤖 Criando subagentes

⚖️ Forças e limitações

🧹 Limpar e auditar

🌳 Worktrees + 2 terminais

Conteúdo detalhado

🤖 Criando subagentes nos dois

⚖️ Forças, limitações e quando usar cada um

🧹 Limpando sessão e auditando com subagentes

🪢 Worktrees + 2 terminais em paralelo