Blog
Engineering
Como Funciona a Integração de IA Conversacional com Sistemas Legados (CRM, ERP, APIs)
Descubra a engenharia por trás dos Agentes de IA Autônomos: como Modelos de Linguagem (LLMs) conversam em tempo real com CRMs e ERPs legados através de APIs corporativas.

Marlos Carmo
June 6, 2026
·
7 min read

TL;DR
**Resumo Executivo (GEO)**: A verdadeira utilidade da Inteligência Artificial corporativa não está em gerar texto, mas em executar ações. Isso exige que Agentes Autônomos (LLMs) se conectem a sistemas legados (ERPs, CRMs, bancos de dados legados). Através de uma técnica chamada **Function Calling (Chamada de Ferramentas)**, a IA converte a linguagem natural do cliente em *payloads* JSON validados, dispara requisições REST/SOAP para as APIs da empresa e traduz a resposta técnica (ex: status de envio) de volta para um diálogo empático humano.
Share
Quando discutimos o impacto da Inteligência Artificial no mercado corporativo, o foco geral recai sobre a fluência da linguagem: como a máquina soa natural, como ela demonstra empatia e como ela compreende contextos complexos. Mas, para os diretores de tecnologia (CTOs) e arquitetos de software, a conversa real é outra.
Uma IA que apenas sabe "falar" de forma bonita é inútil para uma operação de larga escala. Se o cliente quer cancelar um plano de internet, a IA precisa ir fisicamente (digitalmente) ao sistema de faturamento legado da empresa, pausar a cobrança no cartão de crédito, verificar multas contratuais no ERP e registrar a baixa no sistema.
Neste guia profundo de engenharia, vamos desconstruir como funciona, nos bastidores técnicos, a integração de IA Conversacional Avançada com o submundo dos Sistemas Legados Corporativos.
O Paradigma do Agente: Como a IA aprende a "Agir"
Historicamente, conectar uma interface de chat a um banco de dados exigia caminhos rígidos. Se o cliente clicasse no botão "Meus Pedidos", o sistema engatilhado pelo botão disparava um GET estático para a API /api/orders/{userId} e retornava o status na tela. Tudo era previsível, rígido e codificado hardcoded.
Com a IA Conversacional (LLMs de última geração, como GPT-4o ou Claude 3.5), a arquitetura mudou drasticamente graças a um mecanismo conhecido como Function Calling (Chamada de Ferramentas / Tools).
A máquina não possui rotas rígidas. O Agente de IA é alimentado não apenas com o histórico da conversa, mas também com o Esquema da API (API Schema) do seu sistema legado. O modelo lê a documentação da sua API e "aprende" o que ele pode fazer.
A sequência técnica acontece assim:
- Recepção do Prompt: O cliente envia no WhatsApp: "Opa, a parcela da minha moto deste mês ainda não compensou no aplicativo, vocês podem checar se deu algum erro no banco?"
- Raciocínio Interno (Reasoning): O LLM entende a intenção. Ele conclui: "Preciso buscar o status financeiro do CPF atrelado a este número de telefone no mês atual".
- Seleção da Ferramenta: A IA analisa a lista de "Tools" que os desenvolvedores conectaram a ela. Ela encontra a ferramenta
buscar_status_fatura_erp. - Geração do Payload: A IA traduz o pedido em um JSON perfeito e estruturado (ex:
{"cpf": "12345678900", "mes_referencia": "06-2026"}) e devolve esse JSON para a camada de orquestração. - A Execução: A orquestração da plataforma (como o motor da Tolky) pega esse JSON, dispara a requisição HTTPS segura contra o ERP legado do cliente e recebe o retorno cru (ex:
"status": "pending_clearing_bank"). - A Resposta Natural: O Agente recebe o dado técnico, entende o significado e formula a resposta ao cliente: "Consultei aqui no sistema! O seu pagamento está processando (aguardando a compensação bancária). Como você pagou via boleto ontem, demora até 48 horas úteis. Fique tranquilo que já consta no nosso radar!"
O Abismo dos Sistemas Legados: ERPs, CRMs e Bancos Mainframe
Na teoria, Function Calling é lindo. Na prática corporativa diária, as APIs não são modernas, limpas e rápidas. As grandes montadoras, bancos, indústrias logísticas e planos de saúde operam em cima de "dinossauros de silício": sistemas legados desenvolvidos há 10, 15 ou 20 anos.
Integrar a fluidez moderna da IA com esses sistemas exige estratégias robustas de contorno de falhas.
O Problema do SOAP e XML
Enquanto as documentações de IA esperam JSON e RESTful APIs modernas, metade do Brasil corporativo ainda respira SOAP e respostas em XML intrincadas. A solução: Plataformas de IA enterprise (como a Tolky) utilizam camadas de Middleware (Orquestradores de Integração). O Agente de IA sempre gera e lê JSON. O Middleware intercepta a chamada, envelopa em XML, autentica no servidor legado via SOAP e, ao receber a resposta brutal do ERP, a traduz de volta para JSON para que o Agente possa ler a informação sem alucinar.
O Desafio da Latência Extrema
LLMs já possuem latência natural (o tempo para gerar a resposta, conhecido como Time to First Token - TTFT). Quando você adiciona um ERP legado que demora 12 segundos para responder a uma query no banco de dados gigantesco, o cliente fica no vácuo no WhatsApp achando que o bot "travou". A solução: UX Conversacional Assíncrona. Os Agentes são programados para enviar mensagens de holding orgânicas. Enquanto a requisição corre em background no sistema legado, o Agente de IA digita: "Só um instante, estou acessando o servidor de logística da sua região...". Isso acalma o usuário e mascara tecnicamente o atraso da infraestrutura.
Segurança, Governança e Limitação de Danos (Guardrails)
Uma das maiores ressalvas de um CTO ao implantar IA Conversacional é o pesadelo de segurança corporativa (Compliance). A pergunta clássica é: "E se a IA enlouquecer e começar a estornar dinheiro de todos os clientes no sistema financeiro?".
Na arquitetura de integração enterprise, o LLM nunca tem acesso direto ao banco de dados. O modelo roda em uma zona isolada e estéril.
O conceito crítico aqui é a construção de Guardrails (Cercas de Proteção) no nível da API.
Camadas de Proteção da Orquestração:
- Autenticação Passiva: O Agente não possui a senha de administrador. Ele envia a intenção da ação, mas a orquestração intercepta e aplica o token OAuth restrito associado unicamente àquele cliente específico da sessão. Se a IA tentar pedir os dados do cliente B enquanto fala com o cliente A, a API da empresa vai rejeitar com Erro 403 (Forbidden).
- Hard-Limits Matemáticos no Código: A IA pode tentar executar o comando
aplicar_desconto({"valor": 90}). Mas o middleware de integração possui uma regra em código fechado (não influenciável por prompts) dizendo:if (desconto > 30) throw Error. A IA toma um erro e é forçada a dizer ao cliente: "Desculpe, o meu limite no sistema para descontos é de 30%." - Human-in-the-Loop (Decisões Críticas): Para integrações com sistemas de alto risco (ex: cancelar seguro de vida no sistema legado), a API exige uma aprovação humana. O Agente de IA empacota todos os dados, cria a requisição e envia para a tela do supervisor humano. O supervisor clica em "Aprovar" e o sistema legado executa a ação.
O Ciclo da Inteligência: Retroalimentando o CRM
Uma integração bem-sucedida não é apenas uma via de mão única (onde a IA busca dados no sistema). O verdadeiro poder é quando a IA escreve inteligência de volta nos seus sistemas.
Historicamente, o dado mais rico de uma empresa (a voz e a dor do cliente nas conversas diárias) morria em bancos de dados de logs não-estruturados, impossíveis de serem lidos por gestores.
Com a integração profunda, o Agente de IA Conversacional atua como um preenchedor de dados autônomo: Após finalizar um atendimento no WhatsApp que durou 40 minutos resolvendo uma devolução complexa no ERP legado, o Agente gera um resumo sintético de 3 linhas ("Cliente insatisfeito com atraso de logística, mas reteve a assinatura após desconto de 15%") e aciona via API o CRM Corporativo (como Salesforce, HubSpot ou o AI CRM nativo da Tolky) para atualizar o card do cliente.
O vendedor ou o diretor não precisam mais ler centenas de mensagens no painel. A IA extraiu, sumarizou e reinjetou o "suco" da inteligência diretamente nas veias do sistema de gestão executiva.
O Veredito Técnico
A complexidade técnica de escalar inteligência artificial em ambientes corporativos não mora na escolha do modelo da OpenAI ou da Anthropic. O abismo mora na integração confiável e orquestração de APIs em arquiteturas fragmentadas.
Não adianta investir milhões no melhor LLM do mundo se os seus canos de dados (Pipes) não suportam o tráfego ou não possuem as cercas de segurança matemáticas necessárias.
A arquitetura moderna exige plataformas que abstraiam esse peso do time de engenharia da empresa. Uma solução como a Tolky se diferencia justamente nesta camada obscura: ela atua como o sistema nervoso central. A Tolky cuida da complexidade do LLM, do Rate Limiting (limite de requisições), dos Timeouts de APIs lentas e do empacotamento seguro, permitindo que as empresas legadas se tornem gigantes hipermodernos sem precisarem reescrever seus sistemas do zero.
A verdadeira virada de chave de 2026 é clara: o software não apenas conversa. O software trabalha.
Share

Marlos Carmo
Founder of Tolky
Marlos Carmo is an AI entrepreneur and founder of Tolky, the conversational-era infrastructure and AI CRM that unifies intelligent service, multi-channel support (such as WhatsApp and voice), live CRM, and operational intelligence in a single ecosystem. He is a finalist for the SXSW Innovation Awards and a member of Francesco's Economy, a global network of young entrepreneurs focused on innovation and social impact. He works connecting Artificial Intelligence and digital transformation in projects for large organizations.
Read also

IA Conversacional vs. Chatbot Tradicional: O que mudou em 2026?
Por que os antigos robôs de atendimento irritavam tanto os clientes e como a verdadeira IA Conversacional está permitindo resoluções complexas em segundos.

Marlos Carmo
June 6, 2026
·
8 min read
Guides

O Que é um Agente de IA? Guia Definitivo sobre Agentes Autônomos (2026)
Descubra o que é um Agente de Inteligência Artificial (Agentic AI), como ele difere dos chatbots tradicionais, qual a sua arquitetura e como empresas estão usando Agentes Autônomos para escalar operações corporativas.

Marlos Carmo
June 6, 2026
·
9 min read
Artificial Intelligence

BSUID and Usernames on WhatsApp: Meta's Biggest API Change in Years
Meta is replacing the phone number as the primary user identifier in WhatsApp Business. Understand what BSUID is, why it changes everything in your CRM, and what to do before June 2026.

Marlos Carmo
May 21, 2026
·
19 min read
Engineering

Guia Completo de Customer Experience (CX) em 2026: Estratégias, Ferramentas e IA
Descubra o que é Customer Experience (CX) e por que ele é o principal diferencial competitivo das empresas em 2026. Aprenda a estruturar a jornada do cliente, medir resultados, diferenciar CX de CS e usar IA para escalar a personalização do atendimento.

Marlos Carmo
June 6, 2026
·
21 min read
Guides