Victor Coimbra foi reconhecido na lista Forbes Under 30 Brasil por suas contribuições excepcionais para AI . Ele foi cofundador das operações Artefactna América Latina, que hoje funcionam como um centro tecnológico global com 200 funcionários. Ele traz uma profunda experiência na ampliação AI e na formação de equipes tecnológicas de alto desempenho em mercados internacionais.

Na Parte 1, analisamos o problema: AI perdem eficiência com o tempo, o desempenho em testes de benchmark mascara falhas na produção e até mesmo profissionais experientes podem trabalhar mais lentamente com AI do que sem ela. A trajetória é promissora. A realidade atual é complicada.

Então, como se criam sistemas que realmente permitam manter o ritmo de trabalho por várias horas?

Três abordagens surgiram em diferentes comunidades — cada uma delas abordando o mesmo problema fundamental: como um AI mantém um progresso coerente quando sua memória de trabalho é limitada?

Abordagem 1: Ciclo de reinício

No final de 2025, uma técnica com o nome absurdo de “Ralph Wiggum” se tornou viral entre os profissionais da área. O nome vem de um personagem dos Simpsons — deliberadamente engraçado, pois a ideia central é quase vergonhosamente simples.

Deixe a AI . Quando a qualidade começar a piorar, interrompa-a. Comece do zero. Deixe-a retomar de onde parou.

É isso mesmo. A AI em uma tarefa até que seu desempenho comece a diminuir. Então, ela para, salva seu progresso em um arquivo e encerra a sessão. Uma nova sessão começa do zero. A AI o que foi realizado, identifica o que ainda falta e continua.

A filosofia: pare de lutar contra a limitação de memória. Trabalhe com ela. Cada sessão de trabalho opera de forma independente. O progresso fica registrado nos documentos e registros, não na cabeça AI.

Como isso funciona na prática

Uma implementação típica passa por três fases:

  • Fase 1 (Requisitos): Pessoas e AI para identificar o que precisa ser feito. O resultado é um documento de especificações claro.
  • Fase 2 (Planejamento): AI a diferença entre as especificações e a situação atual. Resultado: uma lista de tarefas priorizadas. Ainda não há trabalho prático.
  • Fase 3 (Execução): AI uma tarefa por sessão. Conclui a tarefa, verifica se funcionou, documenta o que foi feito e encerra. Nova sessão. Repete.

A principal restrição: as tarefas devem ter uma conclusão claramente mensurável. Essa abordagem não funciona bem para requisitos ambíguos, decisões discricionárias ou trabalhos exploratórios sem objetivos finais claros.

Resultados dos primeiros usuários

Os números apresentados pelos profissionais são impressionantes, embora sejam baseados emreports em estudos controlados.

Um consultor concluiu o que teria sido um projeto de US$ 50.000 gastando menos de US$ 300 em AI — executando sessões automatizadas durante a madrugada. A equipe de uma startup concluiu seis entregas importantes durante a madrugada, com resultados funcionais, verificação e documentação. Um profissional desenvolveu um produto inteiro ao longo de três meses de sessões automatizadas.

Os custos típicos variam entre US$ 50 e US$ 100 para projetos de grande porte com mais de 50 sessões de trabalho. Cada sessão tem duração de 30 a 45 minutos antes do ciclo.

A Anthropic formalizou essa abordagem em dezembro de 2025, lançando o suporte oficial. O padrão passou de uma solução alternativa para uma metodologia recomendada.

A limitação

Essa abordagem é determinística em um mundo imprevisível. Como diz um profissional da área: “É melhor fracassar de forma previsível do que ter sucesso de forma imprevisível.”

Essa é tanto a força quanto a limitação. O ciclo de recomeço funciona quando é possível definir claramente o que é sucesso. Ele enfrenta dificuldades quando o sucesso é subjetivo, quando a qualidade é implícita e quando a resposta “certa” exige o julgamento humano para ser reconhecida.

Abordagem 2: Memória seletiva

O ciclo de reinício apaga tudo entre as sessões. Cada ciclo começa do zero. E se fosse possível preservar seletivamente as partes importantes?

A memória seletiva adota uma abordagem diferente: extrair e armazenar as informações essenciais, descartando o restante. Em vez de começar do zero, a AI um resumo selecionado do que realmente importa.

O padrão de dois papéis

Uma implementação comum utiliza duas AI especializadas AI :

  • Função de configuração: Executada apenas no início. Estabelece o contexto, identifica as informações essenciais e cria os documentos de referência iniciais.
  • Função: É responsável por todas as sessões subsequentes. Mantém a continuidade por meio de três recursos: um rastreador de progresso que mostra o trabalho concluído e pendente, uma lista de verificação com itens marcados como concluídos ou pendentes e um histórico de alterações que mostra o que foi modificado e por quê.

O início da sessão é explícito: confirmar o estado atual, analisar os documentos de acompanhamento, selecionar as tarefas pendentes de maior prioridade e verificar a linha de base antes de iniciar novas tarefas.

A diferença em relação ao ciclo de reinício: a etapa de compactação. A Função de Trabalho herda um resumo selecionado do contexto relevante. Pesquisas sugerem que essa abordagem permite AI conclua longas sequências de tarefas utilizando apenas 16% das informações que, de outra forma, seriam necessárias. Uma redução de 84% na sobrecarga.

Memória Avançada: Preservação de Relacionamentos

O estado da arte em memória seletiva preserva não apenas fatos, mas também relações.

Pense em como os seres humanos se lembram dos projetos. Não nos limitamos a recordar fatos isolados. Lembramos que essa decisão levou àquela consequência, que essa pessoa é responsável por aquilo, que esse documento está relacionado àquele requisito. As conexões são tão importantes quanto o conteúdo.

Os sistemas avançados AI agora capturam essas relações. Ao armazenar informações, eles extraem não apenas o que aconteceu, mas quem esteve envolvido, com o que isso se relacionava e por que era importante. Ao recuperar informações, eles conseguem reconstruir o contexto seguindo esses fios de relação.

Métricas de desempenho desses sistemas: melhoria de 26% nas avaliações de qualidade. Redução de mais de 90% na sobrecarga de informações, mantendo a coerência. Melhoria significativa no gerenciamento de tarefas que abrangem várias sessões.

A escolha

A memória seletiva aumenta a complexidade. É preciso ter uma infraestrutura para armazenamento e recuperação. É preciso decidir o que manter e o que descartar. É preciso confiar que a compactação preserve o que é importante.

Este problema ainda não está resolvido. Os sistemas de memória podem perder detalhes essenciais. A compactação pode introduzir distorções sutis. A AI recuperar o contexto errado no momento errado. A redução de 84% parece impressionante, até que se perceba que os 16% que restaram estavam faltando algo essencial.

Abordagem 3: Coordenação da equipe

E se a resposta não for uma AI melhor memória, mas sim vários AI com funções bem definidas?

A coordenação de equipes divide o trabalho complexo em funções especializadas, coordenadas por um gerente central. Cada função tem um escopo definido, necessidades de informação limitadas e uma tarefa específica. O gerente mantém uma visão geral e encaminha apenas as informações relevantes a cada colaborador.

O padrão por trás dos bastidores

AI principais AI utilizam isso internamente. A estrutura:

Coordenador: Um AI capaz, responsável por analisar solicitações, planejar a abordagem, gerenciar a memória e orientar os especialistas.

Especialistas: AI especializados que operam em paralelo para tarefas específicas.

O resultado: os sistemas baseados em equipes superam AI individuais em 90% em tarefas complexas de pesquisa. Não se trata de uma melhoria insignificante. É quase o dobro do desempenho.

A principal conclusão: a gestão da informação explica 80% das diferenças de desempenho na AI em equipe. As ferramentas específicas e AI são menos importantes do que a forma como a informação circula entre as funções.

Dois padrões de coordenação

Padrão de transferência: Um AI passa o controle para outro no meio de uma tarefa. Cada um tem conhecimento da existência do outro e decide quando ceder o controle. A thread de trabalho continua, mas a responsabilidade é transferida. Funciona bem para fluxos de trabalho sequenciais e em etapas.

Padrão de Gerente: Um coordenador central atribui tarefas a especialistas e coleta os resultados. Os especialistas entregam os resultados; o coordenador mantém o controle e toma as decisões. Não há transferência da thread principal. Funciona bem para processamento paralelo e síntese de resultados.

A escolha depende do seu fluxo de trabalho. As transferências funcionam bem quando as tarefas se dividem naturalmente em etapas. Os padrões de gerenciamento funcionam bem quando é necessário um processamento paralelo com tomada de decisão centralizada.

Padronização do setor

Em 2025, o setor padronizou a forma como AI se conectam entre si e a recursos externos. Pense nisso como a padronização das tomadas elétricas — agora, produtos de diferentes fabricantes podem funcionar juntos.

Uma norma define como AI a fontes de informação e ferramentas. Outra define como AI se comunicam entre si. Juntas, elas constituem os blocos de construção que podem ser combinados em diferentes configurações.

Isso é importante porque permite a modularidade. Um fluxo de trabalho criado por uma equipe pode incorporar componentes desenvolvidos por outra. Os sistemas de memória tornam-se intercambiáveis. As fontes de informação tornam-se localizáveis. OAI não é apenas marketing — é uma realidade técnica que esses padrões tornam possível.

As despesas gerais

AI baseada em equipes AI aproximadamente 15 vezes mais recursos do que AI de interação única. Esse é o custo da coordenação. Em tarefas simples, essa sobrecarga supera qualquer benefício. Em tarefas complexas, o aumento da confiabilidade justifica o gasto.

Os modos de falha também são mais complexos. Um projeto deficiente de transição levou uma empresa de comércio eletrônico a registrar uma taxa de abandono de 40% entre os clientes, quando AI confundiram os usuários. Falhas em cascata podem se propagar pelas AI . Uma análise do setor realizada em 2025 identificou 14 padrões distintos de falha relacionados ao projeto do sistema, falhas de coordenação e verificação de qualidade.

Escolhendo a abordagem certa

Eis o que penso sobre essas opções:

  • O ciclo de recomeço funciona quando as tarefas têm uma conclusão claramente mensurável, você consegue aceitar um progresso incremental previsível, o progresso pode ser totalmente registrado em documentos e registros, e você prefere a simplicidade à sofisticação.
  • A memória seletiva é eficaz quando as tarefas exigem a preservação de relações entre sessões, você dispõe de infraestrutura para armazenamento e recuperação, a eficiência é importante em escala e você pode investir na criação de sistemas de compactação.
  • A coordenação de equipes funciona quando as tarefas se dividem naturalmente em subtarefas especializadas, é necessário o processamento paralelo, a sobrecarga de coordenação (15 vezes mais recursos) é aceitável e é possível lidar com modos de falha mais complexos.

A maioria dos sistemas de produção combina elementos dos três. Um sistema baseado em equipes, no qual cada especialista utiliza ciclos de reinício. Um coordenador com memória ampliada que dirige trabalhadores sem estado. As abordagens são complementares, não exclusivas.

O ponto em comum: todas as três abordagens externalizam informações que a AI manter de forma confiável internamente. Elas diferem quanto ao volume de informações externalizadas e à forma como gerenciam a recuperação dessas informações.

Na Parte 3, examinaremos o que AI de longa duração AI para as organizações: como o trabalho muda, que tipo de governança é necessária e quais são as oportunidades realistas em 2026.

 

Referências

Artigos científicos

Reports do setor Reports white papers

  • Modos de falha em AI — Microsoft
  • Lições de 2025 sobre AI confiança — Google Cloud
  • O estado da AI — LangChain
  • Avaliação em ambiente de teste versus avaliação no mundo real — METR

Documentação Técnica

  • Como criamos nosso sistema de pesquisa com múltiplos agentes — Anthropic
  • Especificação do Protocolo de Contexto de Modelo — modelcontextprotocol.io
  • Documentação do Fresh-Start Cycling (“Ralph Wiggum”) — Geoffrey Huntley (ghuntley.com/ralph/)