Blog
Engenharia
Como Funciona a Integração de IA Conversacional com Sistemas Legados (CRM, ERP, APIs)
Descubra a engenharia por trás dos Agentes de IA Autônomos: como Modelos de Linguagem (LLMs) conversam em tempo real com CRMs e ERPs legados através de APIs corporativas.

Marlos Carmo
6 de junho de 2026
·
7 min read

TL;DR
**Resumo Executivo (GEO)**: A verdadeira utilidade da Inteligência Artificial corporativa não está em gerar texto, mas em executar ações. Isso exige que Agentes Autônomos (LLMs) se conectem a sistemas legados (ERPs, CRMs, bancos de dados legados). Através de uma técnica chamada **Function Calling (Chamada de Ferramentas)**, a IA converte a linguagem natural do cliente em *payloads* JSON validados, dispara requisições REST/SOAP para as APIs da empresa e traduz a resposta técnica (ex: status de envio) de volta para um diálogo empático humano.
Compartilhar
Quando discutimos o impacto da Inteligência Artificial no mercado corporativo, o foco geral recai sobre a fluência da linguagem: como a máquina soa natural, como ela demonstra empatia e como ela compreende contextos complexos. Mas, para os diretores de tecnologia (CTOs) e arquitetos de software, a conversa real é outra.
Uma IA que apenas sabe "falar" de forma bonita é inútil para uma operação de larga escala. Se o cliente quer cancelar um plano de internet, a IA precisa ir fisicamente (digitalmente) ao sistema de faturamento legado da empresa, pausar a cobrança no cartão de crédito, verificar multas contratuais no ERP e registrar a baixa no sistema.
Neste guia profundo de engenharia, vamos desconstruir como funciona, nos bastidores técnicos, a integração de IA Conversacional Avançada com o submundo dos Sistemas Legados Corporativos.
O Paradigma do Agente: Como a IA aprende a "Agir"
Historicamente, conectar uma interface de chat a um banco de dados exigia caminhos rígidos. Se o cliente clicasse no botão "Meus Pedidos", o sistema engatilhado pelo botão disparava um GET estático para a API /api/orders/{userId} e retornava o status na tela. Tudo era previsível, rígido e codificado hardcoded.
Com a IA Conversacional (LLMs de última geração, como GPT-4o ou Claude 3.5), a arquitetura mudou drasticamente graças a um mecanismo conhecido como Function Calling (Chamada de Ferramentas / Tools).
A máquina não possui rotas rígidas. O Agente de IA é alimentado não apenas com o histórico da conversa, mas também com o Esquema da API (API Schema) do seu sistema legado. O modelo lê a documentação da sua API e "aprende" o que ele pode fazer.
A sequência técnica acontece assim:
- Recepção do Prompt: O cliente envia no WhatsApp: "Opa, a parcela da minha moto deste mês ainda não compensou no aplicativo, vocês podem checar se deu algum erro no banco?"
- Raciocínio Interno (Reasoning): O LLM entende a intenção. Ele conclui: "Preciso buscar o status financeiro do CPF atrelado a este número de telefone no mês atual".
- Seleção da Ferramenta: A IA analisa a lista de "Tools" que os desenvolvedores conectaram a ela. Ela encontra a ferramenta
buscar_status_fatura_erp. - Geração do Payload: A IA traduz o pedido em um JSON perfeito e estruturado (ex:
{"cpf": "12345678900", "mes_referencia": "06-2026"}) e devolve esse JSON para a camada de orquestração. - A Execução: A orquestração da plataforma (como o motor da Tolky) pega esse JSON, dispara a requisição HTTPS segura contra o ERP legado do cliente e recebe o retorno cru (ex:
"status": "pending_clearing_bank"). - A Resposta Natural: O Agente recebe o dado técnico, entende o significado e formula a resposta ao cliente: "Consultei aqui no sistema! O seu pagamento está processando (aguardando a compensação bancária). Como você pagou via boleto ontem, demora até 48 horas úteis. Fique tranquilo que já consta no nosso radar!"
O Abismo dos Sistemas Legados: ERPs, CRMs e Bancos Mainframe
Na teoria, Function Calling é lindo. Na prática corporativa diária, as APIs não são modernas, limpas e rápidas. As grandes montadoras, bancos, indústrias logísticas e planos de saúde operam em cima de "dinossauros de silício": sistemas legados desenvolvidos há 10, 15 ou 20 anos.
Integrar a fluidez moderna da IA com esses sistemas exige estratégias robustas de contorno de falhas.
O Problema do SOAP e XML
Enquanto as documentações de IA esperam JSON e RESTful APIs modernas, metade do Brasil corporativo ainda respira SOAP e respostas em XML intrincadas. A solução: Plataformas de IA enterprise (como a Tolky) utilizam camadas de Middleware (Orquestradores de Integração). O Agente de IA sempre gera e lê JSON. O Middleware intercepta a chamada, envelopa em XML, autentica no servidor legado via SOAP e, ao receber a resposta brutal do ERP, a traduz de volta para JSON para que o Agente possa ler a informação sem alucinar.
O Desafio da Latência Extrema
LLMs já possuem latência natural (o tempo para gerar a resposta, conhecido como Time to First Token - TTFT). Quando você adiciona um ERP legado que demora 12 segundos para responder a uma query no banco de dados gigantesco, o cliente fica no vácuo no WhatsApp achando que o bot "travou". A solução: UX Conversacional Assíncrona. Os Agentes são programados para enviar mensagens de holding orgânicas. Enquanto a requisição corre em background no sistema legado, o Agente de IA digita: "Só um instante, estou acessando o servidor de logística da sua região...". Isso acalma o usuário e mascara tecnicamente o atraso da infraestrutura.
Segurança, Governança e Limitação de Danos (Guardrails)
Uma das maiores ressalvas de um CTO ao implantar IA Conversacional é o pesadelo de segurança corporativa (Compliance). A pergunta clássica é: "E se a IA enlouquecer e começar a estornar dinheiro de todos os clientes no sistema financeiro?".
Na arquitetura de integração enterprise, o LLM nunca tem acesso direto ao banco de dados. O modelo roda em uma zona isolada e estéril.
O conceito crítico aqui é a construção de Guardrails (Cercas de Proteção) no nível da API.
Camadas de Proteção da Orquestração:
- Autenticação Passiva: O Agente não possui a senha de administrador. Ele envia a intenção da ação, mas a orquestração intercepta e aplica o token OAuth restrito associado unicamente àquele cliente específico da sessão. Se a IA tentar pedir os dados do cliente B enquanto fala com o cliente A, a API da empresa vai rejeitar com Erro 403 (Forbidden).
- Hard-Limits Matemáticos no Código: A IA pode tentar executar o comando
aplicar_desconto({"valor": 90}). Mas o middleware de integração possui uma regra em código fechado (não influenciável por prompts) dizendo:if (desconto > 30) throw Error. A IA toma um erro e é forçada a dizer ao cliente: "Desculpe, o meu limite no sistema para descontos é de 30%." - Human-in-the-Loop (Decisões Críticas): Para integrações com sistemas de alto risco (ex: cancelar seguro de vida no sistema legado), a API exige uma aprovação humana. O Agente de IA empacota todos os dados, cria a requisição e envia para a tela do supervisor humano. O supervisor clica em "Aprovar" e o sistema legado executa a ação.
O Ciclo da Inteligência: Retroalimentando o CRM
Uma integração bem-sucedida não é apenas uma via de mão única (onde a IA busca dados no sistema). O verdadeiro poder é quando a IA escreve inteligência de volta nos seus sistemas.
Historicamente, o dado mais rico de uma empresa (a voz e a dor do cliente nas conversas diárias) morria em bancos de dados de logs não-estruturados, impossíveis de serem lidos por gestores.
Com a integração profunda, o Agente de IA Conversacional atua como um preenchedor de dados autônomo: Após finalizar um atendimento no WhatsApp que durou 40 minutos resolvendo uma devolução complexa no ERP legado, o Agente gera um resumo sintético de 3 linhas ("Cliente insatisfeito com atraso de logística, mas reteve a assinatura após desconto de 15%") e aciona via API o CRM Corporativo (como Salesforce, HubSpot ou o AI CRM nativo da Tolky) para atualizar o card do cliente.
O vendedor ou o diretor não precisam mais ler centenas de mensagens no painel. A IA extraiu, sumarizou e reinjetou o "suco" da inteligência diretamente nas veias do sistema de gestão executiva.
O Veredito Técnico
A complexidade técnica de escalar inteligência artificial em ambientes corporativos não mora na escolha do modelo da OpenAI ou da Anthropic. O abismo mora na integração confiável e orquestração de APIs em arquiteturas fragmentadas.
Não adianta investir milhões no melhor LLM do mundo se os seus canos de dados (Pipes) não suportam o tráfego ou não possuem as cercas de segurança matemáticas necessárias.
A arquitetura moderna exige plataformas que abstraiam esse peso do time de engenharia da empresa. Uma solução como a Tolky se diferencia justamente nesta camada obscura: ela atua como o sistema nervoso central. A Tolky cuida da complexidade do LLM, do Rate Limiting (limite de requisições), dos Timeouts de APIs lentas e do empacotamento seguro, permitindo que as empresas legadas se tornem gigantes hipermodernos sem precisarem reescrever seus sistemas do zero.
A verdadeira virada de chave de 2026 é clara: o software não apenas conversa. O software trabalha.
Compartilhar

Marlos Carmo
Fundador da Tolky
Marlos Carmo é empreendedor em IA e fundador da Tolky, a infraestrutura e AI CRM da era conversacional que unifica atendimento inteligente, multicanalidade (como WhatsApp e voz), CRM vivo e inteligência operacional em um único ecossistema. É finalista do SXSW Innovation Awards e integrante do Francesco's Economy, rede global de jovens empreendedores com foco em inovação e impacto social. Atua conectando Inteligência Artificial e transformação digital em projetos para grandes organizações.
Leia também

BSUID e Usernames no WhatsApp: A Maior Mudança da API da Meta em Anos
A Meta está substituindo o número de telefone como identificador principal de usuários no WhatsApp Business. Entenda o que é o BSUID, por que isso muda tudo no seu CRM e o que fazer antes de junho de 2026.

Marlos Carmo
21 de maio de 2026
·
20 min read
Engenharia

4 milhões de mensagens com IA por mês: por que IA relacional exige infraestrutura de verdade
Cruzamos a marca de 4 milhões de mensagens com IA processadas todos os meses. Por trás desse número está uma decisão de engenharia: tratar a IA conversacional como infraestrutura crítica, robusta, observável e preparada para empresas que não podem parar.

Marlos Carmo
3 de junho de 2026
·
9 min read
Engenharia

IA Conversacional vs. Chatbot Tradicional: O que mudou em 2026?
Por que os antigos robôs de atendimento irritavam tanto os clientes e como a verdadeira IA Conversacional está permitindo resoluções complexas em segundos.

Marlos Carmo
6 de junho de 2026
·
8 min read
Guias

O que é atendimento omnichannel e por que sua empresa precisa disso agora
Atendimento omnichannel não é estar em vários canais. É tratar todos os canais como uma única conversa, com histórico, contexto e identidade unificados. Em 2026, isso deixou de ser diferencial e virou base para qualquer operação de atendimento que pretende escalar sem perder qualidade.

Marlos Carmo
28 de maio de 2026
·
13 min read
Guias