Módulo 14 — Padrões de Arquitetura para IA em Produção
Saber usar o modelo é o básico. Arquitetar sistemas de IA que escalam, controlam custo, entregam latência aceitável e não falham em produção é o diferencial. Este módulo cobre os patterns que aparecem em toda implementação séria de IA generativa.
Tópicos
14-01-01
Patterns: RAG, agentic workflow, prompt chaining, routing, parallelization
15 min14-01-02
Orchestrator-workers, evaluator-optimizer
12 min14-01-03
Caching (semantic cache), batching, streaming
12 min14-02-01
Cost optimization: model routing, distillation, prompt compression
12 min14-02-02
Latency: small models, edge, Phi family, Foundry Local
12 min14-02-03
Reference architectures Microsoft (Azure Architecture Center)
15 min14-03-01
Anti-patterns comuns em IA generativa
12 min14-03-02
Desafio: arquitetura assistente jurídico
10 min