AI Agents Aren’t Ready for Consumer-Facing Work – But They Can Excel at Internal Processes.

Leia o artigo em

A adoção pelos consumidores também continua relativamente baixa. Apesar do uso de palavras como “revolução”, o” data mostra que a maioria dos usuários usa semanalmente e não diariamente, ao contrário do uso mais frequente de redes sociais ou plataformas como o Google. Isso sugere que a geração de IA ainda não se tornou um verdadeiro hábito de consumo. As pessoas a utilizam ocasionalmente - às vezes intensamente - mas ela não se tornou um alicerce da vida cotidiana. Em outras palavras, o hype ainda está à frente da realidade.

Apesar desses reports, acreditamos que a IA de gênero representa uma mudança fundamental na mesma escala que a Internet ou o smartphone. A Internet nos proporcionou cerca de duas décadas de inovação e construção de empresas. A revolução dos smartphones criou 15 anos de crescimento impulsionado por aplicativos móveis. Acreditamos que a IA de geração conduzirá uma era semelhante de transformação - talvez uma década ou mais de criação de novos valores.

Esse padrão é comum com as novas tecnologias (o otimismo excessivo seguido de desilusão e, em seguida, a criação de valor real, muitas vezes articulada por meio de o ciclo de hype da Gartner). Em nossa opinião, muitos dos principais defensores da IA estão exagerando quando fazem declarações ousadas de que setores inteiros da economia serão substituídos em breve pela IA. Isso porque a IA real e funcional em empresas estabelecidas é um trabalho árduo: é necessário um data relativamente limpo, mapeamento de processos e experimentação profunda - e, mesmo assim, muitas vezes é necessário um ser humano no circuito. No entanto, estamos vendo um progresso real nos bastidores, cujos exemplos sugerem que o uso de sistemas multiagentes para automatizar e substituir tarefas repetitivas pode levar a um aumento mais longo e fundamental da produtividade.

Nossa opinião é que os líderes não devem tentar adivinhar o que vai acontecer em 10 anos. Em vez disso, eles devem se perguntar o que podem alcançar de forma realista nos próximos dois anos. Com base nos projetos que realizamos desde o final de 2024, a IA agêntica está provando ser o verdadeiro divisor de águas (pelo menos no curto prazo), proporcionando valor real às empresas. A realidade também é que os ganhos financeiros por projeto são bons, mas nenhum deles é impressionante. Esses ganhos incrementais aqui são semelhantes ao Lean, uma comparação que o CEO da Microsoft, o Sr. Satya Nadella também fez.

Com base em nosso trabalho em um portfólio de projetos que estão implementando com sucesso sistemas de IA agêntica, descobrimos que, para ter sucesso com essa tecnologia, é necessário superar o hype, entender o que a tecnologia pode fazer e combinar essa capacidade com oportunidades claras de criação de valor. Isso também requer uma abordagem prática para a implementação de sistemas multiagentes para experimentar e aprender.

O surgimento do paradigma do fluxo de trabalho agêntico

Nos últimos anos, a maturidade da tecnologia de IA evoluiu rapidamente em pelo menos três fases distintas:

Prompting (2022): O entusiasmo inicial estava centrado nos “power prompts”. Nas provas de conceito (POCs), os prompts pareciam funcionar. Mas na produção, a confiabilidade caiu rapidamente. Os processos comerciais normalmente exigem uma precisão de 95-99%. Com base na experiência de mais de 50 casos, acreditamos que o prompt sozinho raramente ultrapassa 70%.
Retrieval-Augmented Generation (RAG, 2023): O RAG melhorou a estabilidade ao ancorar os resultados da IA gen em bases de conhecimento. Mais uma vez, os POCs pareciam promissores, mas a complexidade da produção frequentemente expunha os pontos fracos que levavam a uma precisão inaceitavelmente baixa.
Sistemas agênticos (de 2024 até o presente): Os avanços mais recentes envolvem redes de agentes pequenos e especializados. Alguns encaminham perguntas. Outros executam tarefas estritamente definidas. Outros ainda verificam e corrigem os resultados. O mais importante é que a queda nos custos dos tokens agora torna os sistemas multiagentes em cascata comercialmente viáveis. Esse design em camadas aumenta significativamente a confiabilidade.

Neste outono, houve uma explosão de iniciativas comerciais agênticas. A OpenAI lançou parcerias com Stripe e Shopify. O Google anunciou seu Protocolo de Pagamento de Agente, que automatiza o processo de compra e transação. Embora as empresas possam se sentir tentadas a seguir o exemplo dos gigantes da tecnologia, talvez não seja aí que surgirá a primeira onda de valor sustentável. Em um pesquisa recente da Bain com consumidores, Em relação às compras, 76% informaram que não se sentiriam à vontade para usar sistemas agênticos - a maioria citou preocupações com segurança e privacidade como motivo de sua reticência.

Os contextos voltados para o cliente não são adequados para os recursos atuais dos agentes de IA. Eles são confusos e imprevisíveis; as entradas não são estruturadas, o tom e o contexto mudam constantemente, e os reguladores e consumidores têm pouca tolerância a alucinações ou erros. Sistemas multiagentes pode O senhor não pediria a uma criança para arrumar a mesa do jantar. O senhor não pediria a uma criança pequena que arrumasse a mesa de jantar. Mas se o senhor dividir a tarefa e orientá-la passo a passo - “primeiro, coloque um prato no chão”, “agora, adicione os garfos”, “depois, os copos” - ela poderá fazer uma contribuição significativa. Crucialmente, o ambiente também deve ser controlado: nenhum irmão barulhento, nenhum animal de estimação que distraia e apenas um dos pais dando instruções. Mas ao desenvolver sistemas multiagentes estruturados da mesma forma que o senhor instrui uma criança - dividindo a tarefa, alimentando as tarefas uma a uma, verificando a precisão das tarefas - estamos criando sistemas extremamente precisos.

Notavelmente, esses sistemas geralmente são para processos de back-end, em que a perfeição não é essencial porque o senhor tem um ser humano no circuito. Por outro lado, embora os experimentos de front-end possam ser inspiradores, é improvável que eles sejam a primeira área de criação de valor real para a empresa. Os processos operacionais e de back-end são um terreno fértil porque são estruturados e repetitivos - muito mais adequados para a automação do fluxo de trabalho agêntico. Tarefas com escopo bem delimitado, ambientes bem definidos e entradas estruturadas podem gerar projetos que fazem uma contribuição significativa.

Criação de sistemas agênticos no nível empresarial

Em escala empresarial, projetar esses sistemas é conceitualmente simples, mas operacionalmente exigente. Como uma estrutura geral para a criação de sistemas multiagentes, 1) uma tarefa é enviada a um agente roteador, como o Google ADK, que, como um pai instruindo uma criança, divide a tarefa em subtarefas; 2) as subtarefas são concluídas por agentes de tarefas individuais que concluem uma parte menor da tarefa, como o pai dizendo a uma criança para colocar os copos na mesa e a outra para colocar os garfos; depois disso, 3) os resultados dessas subtarefas são verificados por um agente de validação; e 4) se for descoberto um erro, um agente de aprimoramento recomenda um ajuste.

Um ecossistema em rápido crescimento de ferramentas, metodologias e serviços dá suporte a essa abordagem, e eles são excelentes para processos não essenciais. Mas quando o senhor passa para as operações principais - em que a integridade e o controle sobre as alucinações do data são essenciais -, precisa de agentes codificados de forma personalizada, de uma integração mais profunda com os sistemas corporativos e da implementação de um melhor controle e de proteções.

Um exemplo de caso: Reinventando as operações de campo

Para ilustrar, considere um projeto que fizemos com um grande provedor de Internet europeu. Nosso objetivo era reduzir o tempo de resolução e o custo das chamadas de serviço a serem resolvidas. A maioria das pessoas já teve a experiência de ligar para um help desk sobre uma conexão interrompida, repetir informações várias vezes e, por fim, esperar por um técnico. O que acontece (ou deixa de acontecer) nos bastidores é revelador: os técnicos geralmente chegam com um contexto incompleto, forçados a solucionar o problema do zero. Isso leva a um longo tempo de inatividade - às vezes, mais de um mês - e a milhares de horas desperdiçadas com o operador.

Decidimos começar aos poucos. Nosso foco foi criar um sistema centrado em ajudar os técnicos a realizar suas tarefas de forma mais rápida e melhor - um ajudante no processo, não um agente autônomo. Como parte desse esforço, integramos o data de mais de 15 sistemas de informação, fornecendo aos técnicos um resumo das falhas relatadas e um histórico de quais soluções haviam sido tentadas. Isso lhes proporcionou uma visão geral da tarefa - por exemplo, a solução de problemas na conexão de um cliente - que eles podiam ler ou ouvir a caminho do trabalho. Dessa forma, eles poderiam começar a trabalhar para solucionar o problema assim que chegassem, economizando o tempo que muitas vezes era desperdiçado para se atualizar sobre o problema.

Em seguida, criamos um recurso que gerava recomendações para a próxima melhor ação para a resolução. Outro recurso incluía uma interface de conversação que permitia que o técnico consultasse os sistemas de TI subjacentes da empresa de Internet em linguagem natural para encontrar as causas principais. Por fim, automatizamos muitas ações simples e repetitivas: por exemplo, a correção de registros de CRM quando a residência errada era vinculada ou o acionamento de reinicializações de rede quando um interruptor apresentava defeito na caixa de conexão do bairro central. Isso economizou muito tempo para o técnico, pois ele não precisou ligar para a central de atendimento interna para obter ajuda com pequenas alterações para fazer a correção.

Durante oito meses, trabalhamos de forma iterativa - mapeando processos, corrigindo pontos problemáticos e adicionando funcionalidades passo a passo, com feedback semanal dos técnicos de campo que testavam a solução baseada em tablet.

Os resultados:

60% redução no tempo de resolução
Mais de um milhão de euros economizados anualmente de forma recorrente
Melhoria significativa no atendimento ao cliente pontuação do promotor líquido

Com base nesses resultados, o cliente queria que ele fosse ampliado para mais sete regiões. Isso exigiu muito mais trabalho: A metodologia e alguns componentes do agente eram reutilizáveis, mas cada região tinha sistemas de TI diferentes. Cada implementação exigia novas integrações e mapeamentos data. A expansão para cada uma das sete regiões exigiu metade do esforço original de um por região adicionada.

Os desafios da implementação de sistemas multiagentes

Conforme ilustrado acima, as implementações de sistemas multiagentes podem criar valor real com sucesso, mas poucas pessoas falam sobre o trabalho real de implementá-los. Quais foram as realidades e os obstáculos que enfrentamos?

Testes rápidos versus aumento de escala.

Nós o construímos em uma arquitetura escalonável e agradável desde o início? Por mais que gostássemos de afirmar isso, teria sido impossível. Assim como os inovadores descobrem iterativamente a adequação produto-mercado, os casos de uso do sistema multiagentes e a solução evoluíram iterativamente à medida que nos envolvemos em um ciclo de experimentação rápida. Além disso, a tecnologia, a metodologia e os serviços para criar esses sistemas evoluíram rapidamente.

Não começamos com o sistema completo. Em vez disso, começamos com um LLM e um RAG como peça central para resolver basicamente o primeiro caso de uso. À medida que testávamos, aprendemos que precisávamos dividir o sistema em agentes menores que realizavam tarefas mais especializadas para aumentar a confiabilidade; lentamente, isso evoluiu para um sistema totalmente agêntico. Por fim, desenvolvemos um sistema altamente confiável e funcional que agrega valor. Com esse conhecimento e os resultados que temos agora, estamos reconstruindo-o em uma arquitetura que é muito mais robusta para escalonar outras partes da empresa e que pode ser mantida com mais facilidade.

Zonas problemáticas vs. causas básicas.

Como regra geral, descobrimos que os líderes e os gerentes intermediários sabem aproximadamente qual processo exige muito tempo ou esforço, mas têm opiniões mal informadas sobre onde está a complexidade e a oportunidade. Somente os operadores sabem disso. A implicação é que o senhor precisa fazer duas coisas antes de realmente começar a construir: 1) dedicar tempo suficiente para entender os problemas do ponto de vista do gerente, mas também 2) conversar com os operadores sobre o que eles entendem como a causa principal de um determinado problema.

Por exemplo, os gerentes nos indicavam as partes do processo em que havia desperdício de tempo ou de recursos (por exemplo, no centro de serviços compartilhados) e nos diziam para procurar os “itens de conhecimento” certos para que o operador resolvesse um problema mais rapidamente. No entanto, quando começamos a trabalhar diretamente com os operadores, descobrimos que metade deles encontrava os “itens de conhecimento” em 10 segundos, enquanto a outra metade levava minutos para encontrar as mesmas informações, pois não eram bons em pesquisar no sistema. Esse não é um problema que a IA agêntica possa resolver bem - é uma questão de treinamento. Mas também descobrimos que os líderes e gerentes haviam ignorado completamente o fato de os operadores passarem cerca de 50% do seu tempo preenchendo o CRM após as chamadas dos clientes. Esse é um bom problema para um agente, que pode transcrever a chamada e colocar todas as informações nos campos certos, acelerando muito o processo e melhorando a qualidade. O operador só precisa verificar e pressionar OK.

Os sistemas de TI não atrasam o senhor - as pessoas é que atrasam.

As partes mais intensas e complexas do nosso trabalho foram participar das discussões gerenciais corretas, conquistar as partes interessadas e identificar e resolver as dependências que ocorreram por causa do nosso trabalho. A integração com uma dúzia de sistemas de TI para fazer a solução funcionar é complexa do ponto de vista tecnológico, mas o verdadeiro desafio é que todos esses sistemas têm suas próprias equipes de desenvolvimento com cronogramas, prioridades e roteiros diferentes. Disponibilizar os pontos de extremidade da API e testá-los pode ser um trabalho de duas semanas. Entrar nos respectivos roteiros desses sistemas levou muito, muito mais tempo. A maioria das equipes com as quais estávamos coordenando despriorizou esse trabalho por vários meses, alegando (provavelmente com validade do ponto de vista delas) que tinham trabalhos mais importantes que eram prioritários.

Os modelos podem e vão ter alucinações.

Os agentes ainda são bastante instáveis e podem ter alucinações, o que exige proteções e verificações fortes na forma de LLM como juiz (o agente de validação). O prompt do sistema do agente precisa ser forte o suficiente e, ainda assim, leve o suficiente para que o agente execute as tarefas adequadamente. Isso requer nuances, tempo e habilidades científicas e de engenharia data para fazer com que esses sistemas agênticos funcionem com confiabilidade alta o suficiente para permitir que sejam executados em sua empresa. Em outras palavras, bons desenvolvedores e experiência em negócios ainda são muito relevantes.

A nova disciplina da transformação autêntica

Que lições mais gerais podemos extrair do caso? De muitas maneiras, parece que o senhor está redescobrindo o trabalho de engenharia enxuta desde o início. A diferença é que o conjunto de ferramentas de hoje é muito mais poderoso, permitindo não apenas a otimização incremental, mas o redesenho completo do processo, mesmo entre departamentos.

Além do data e dos recursos de IA, o sucesso depende de uma profunda alfabetização de processos - entender o estado atual, prever o estado futuro e traduzir isso em etapas pequenas e construíveis. Nesse sentido, estamos vendo o retorno do “Lean Black Belts,mas, desta vez, eles são alimentados por IA gen.

O trabalho é detalhado e metódico, não é glamouroso. O senhor deve seguir passo a passo. A abordagem é escalonada no método, não na mágica. Cada nova área de negócios exige uma nova análise e uma adaptação personalizada.

Os agentes totalmente autônomos ainda estão longe. Por enquanto, a configuração mais eficaz mantém um ser humano no circuito, tornando o operador mais inteligente, mais rápido e mais bem equipado.

No início, o progresso é gradual. Somente quando os sistemas principais se conectam e as informações fluem sem problemas é que surgem grandes ganhos de eficiência.

A tecnologia também evolui mais rapidamente do que os projetos. As ferramentas que usávamos há oito meses já estão desatualizadas. É por isso que nos concentramos em casos de uso com retorno em um ano - antes que a tecnologia subjacente mude.

Mais importante ainda, as empresas devem desenvolver capacidades internas - engenheiros data, cientistas data, designers de UX da geração IA e o que alguns chamam agora de engenheiros de contexto ou faixas pretas da geração IA: pessoas que entendem profundamente os processos e podem dividir a transformação em etapas viáveis. A criação desses recursos como empresa permitirá que o senhor crie novos fluxos de trabalho agênticos mais rapidamente (à medida que a tecnologia evolui), o que pode ser um verdadeiro diferencial em relação à concorrência.

Por fim, embora essas iniciativas acabem se integrando às operações comerciais normais, é essencial iniciá-las com uma governança sólida, que una as perspectivas técnicas e comerciais. Esse equilíbrio é o que transforma a experimentação em transformação.

A próxima década

O hype da geração IA pode ter ultrapassado a adoção, mas seu potencial é real. Assim como as revoluções da Internet e dos smartphones antes dela, essa mudança de plataforma remodelará os setores - não por meio de uma ruptura da noite para o dia, mas por meio de anos de reinvenção disciplinada.

As organizações que vencerem não apenas adotarão ferramentas, mas desenvolverão a capacidade de se reinventar continuamente por meio delas.

Entre em contato conosco

Os agentes AI não estão prontos para o trabalho voltado para o consumidor, mas podem ser excelentes em processos internos.

Autores