05-01-01 — O que é um agente (e o que não é)
TL;DR
Um agente de IA é um LLM equipado com ferramentas, memória e um loop de decisão que lhe permite agir autonomamente para atingir objetivos — sem precisar de instrução passo a passo. Chatbots, RAG puro e pipelines fixos não são agentes: falta o loop e a autonomia de ação.
Definição formal
A definição mais operacional: Agente = LLM + Tools + Memory + Autonomy Loop.
- LLM — o "cérebro" que raciocina, planeja e decide.
- Tools (ferramentas) — capacidades de agir no mundo: buscar na web, chamar APIs, escrever código, ler arquivos.
- Memory — contexto que persiste entre steps: histórico de conversa, resultados de ações anteriores, estado.
- Autonomy Loop — o agente decide por conta própria qual ferramenta usar, em que sequência, e quando parar.
Insight-chave: A diferença entre um LLM e um agente não é o modelo em si — é a arquitetura ao redor. GPT-4 num chatbot não é agente. GPT-4 com tools + loop de decisão é.
O que NÃO é um agente
| Sistema | Por que não é agente |
|---|---|
| Chatbot simples (ex: FAQ bot) | Responde, mas não age. Sem ferramentas, sem loop. |
| RAG puro (Retrieval-Augmented Generation) | Busca documentos e gera resposta. Fluxo fixo, sem decisão autônoma de próximo passo. |
| Pipeline fixo (ex: summarize → translate → send) | Sequência determinística. O LLM executa, não decide. |
| LLM com uma única chamada de ferramenta | Sem loop de observação. Não adapta baseado no resultado da ferramenta. |
Espectro de autonomia
Autonomia não é binária. Existe um espectro:
graph LR
A["🤖 LLM puro\n(apenas geração)"] --> B["📋 Pipeline fixo\n(LLM em steps)"]
B --> C["🔀 Workflow\n(condicional)"]
C --> D["🛠️ Agente assistido\n(human-in-the-loop)"]
D --> E["⚡ Agente autônomo\n(goal-driven)"]
D --> F["🌐 Multi-agent\n(orquestrado)"]
style A fill:#374151,color:#fff
style B fill:#374151,color:#fff
style C fill:#1e40af,color:#fff
style D fill:#065f46,color:#fff
style E fill:#7c2d12,color:#fff
style F fill:#4c1d95,color:#fff
Atenção ao hype: Muitos produtos chamados de "agente" são workflows com if/else. Saber distinguir evita decisões de arquitetura ruins. Pergunte sempre: "O sistema decide autonomamente o próximo passo, ou segue um script?"
Anatomia de um agente real
Um agente em produção tem tipicamente estes componentes:
- System prompt — define objetivo, persona e restrições.
- Tool registry — lista de ferramentas disponíveis com schemas JSON.
- Memory layer — short-term (context window) + opcionalmente long-term (vector DB, DB relacional).
- Execution loop — chama o LLM, executa ferramenta, observa resultado, decide continuar ou parar.
- Termination condition — critério de parada (tarefa concluída, max iterations, erro).
Microsoft context: No ecossistema .NET, agentes são construídos com Semantic Kernel (Microsoft) ou AutoGen. O Semantic Kernel usa o conceito de "planner" para orquestrar o loop de decisão. Azure AI Foundry fornece a infraestrutura de hospedagem.
Por que isso importa para CEOs
Agentes consomem tokens em loop — o custo escala com o número de steps, não apenas com o tamanho da resposta. Um agente que faz 10 chamadas de ferramenta pode custar 10× mais que uma resposta direta. Arquitetura correta desde o início evita surpresas na fatura.
Como isso se conecta
Fontes
- Lilian Weng — "LLM Powered Autonomous Agents" (2023) — referência técnica fundamental sobre arquitetura de agentes.
- Anthropic — "Building Effective Agents" (2024) — patterns práticos de agentes em produção.
- Microsoft — Semantic Kernel Agents docs — implementação no ecossistema .NET.
- OpenAI — Agents SDK announcement (2025) — visão da OpenAI sobre agentes autônomos.