19 de Maio, 202611 min de leitura

As 4 arestas da coordenação humano-agente: H2H, A2A, H2A, A2H em moeda

Toda decisão híbrida salta entre gente e agente por quatro tipos de aresta. Cada uma cobra de um jeito, cada uma é a mais cara num cenário diferente. Como ninguém mede separado, a fatura inteira passa por debaixo do radar.

Resumo em 90 segundos

Toda decisão importante que passa pela sua empresa hoje é uma linha que salta entre caixinhas. Algumas caixinhas são gente, outras são agente de IA. O custo não mora nas caixinhas, mora nas linhas: humano coordenando humano (H2H), agente coordenando agente (A2A), humano coordenando agente (H2A), agente coordenando humano (A2H). Quatro tipos, quatro economias diferentes. A adoção de arquitetura multi-agente disparou em 2025 e 2026, e a maioria das empresas ainda não consegue dizer, com clareza, o que cada agente fez em produção. Quem soma as quatro num número só apaga a distorção mais cara que a onda de IA enfiou na operação, e fica com um total bonito que não diz onde mexer.

Lembre da última decisão de peso que passou pela sua mesa com IA no meio. Renovação de um cliente grande, um ajuste de preço, a aprovação de um orçamento, uma contratação técnica. Antes de sair como ação, ela atravessou uns três humanos e dois agentes, e quase nenhum deles registrou o trajeto.

Foi mais ou menos assim. Um analista pediu ao Claude um rascunho com três cenários, recebeu de volta e ajustou a saída em três rodadas. Mandou pro head de finanças, que abriu o Copilot, cruzou com os números de casa e devolveu duas perguntas pro analista. No fim, os dois sentaram com a liderança financeira pra bater o martelo. Uma decisão só, três pessoas, dois agentes, e quatro tipos diferentes de aresta percorridos sem que ninguém olhasse pro relógio.

Cada aresta dessas cobra de um jeito, e cada uma é a mais cara em um cenário diferente. Como ninguém mede separado, a fatura inteira passa por debaixo do radar.

O grafo da decisão moderna tem quatro tipos de aresta

Chame essa rede de grafo, se quiser o nome técnico, ou de mapa de caixinhas e linhas, dá no mesmo. Os nós, as caixinhas, são de dois tipos só. Tipo H, gente: alguém do time, um terceirizado, um consultor de fora. Tipo A, agente: um modelo com acesso a ferramentas, um agente que roda sozinho, um sistema que decide automatizado e ocupa o lugar de mais um nó. Junte os dois tipos e as ligações entre eles só dão quatro combinações possíveis. Quatro, não mais. E é nessas quatro linhas que o dinheiro escorre.

As 4 arestas da coordenação humano-agente, com exemplo concreto, custo dominante e de qual folha sai a conta numa empresa B2B BR de porte médio. Os valores são modelo de ordem de grandeza: pegue os custos-hora carregados do seu time e refaça a conta com os seus números.
Aresta	Movimento	Exemplo concreto	Custo dominante	Quem paga
H2H	Humano coordena humano	Reunião pra acertar como o time usa o Claude; sênior ratificando a saída da IA; o especialista acionado quando o agente trava.	Tempo síncrono × hora carregada do sênior	Folha de todo mundo na sala
A2A	Agente passa contexto pra agente	Saída do Claude remoldada pra caber no Copilot; passagem entre dois agentes; formato de um pipeline que o outro não engole.	Token (baixo) + conserto humano quando a passagem falha (alto e calado)	Folha de engenharia sênior no conserto
H2A	Humano dispara agente	Analista escreve o prompt e refina de 4 a 6 vezes até a saída prestar; calibragem contínua do comando.	Tempo do sênior × rodadas de prompt	Folha de quem opera
A2H	Agente devolve, humano confere	Quem ratifica olha a saída da IA, checa premissa, pede correção; retrabalho quando o agente erra uma premissa de base.	Tempo de ratificação sênior × chance de retrabalho	Folha de quem ratifica (a mais cara)

Cada aresta tem comportamento econômico distinto. Cada uma cresce por gatilho diferente. Tratá-las como bloco único é exatamente o que produz a fatura escondida que carrega a maior parte do custo de coordenação humano-agente em empresas que adotaram IA nos últimos 18 meses.

H2H: a coordenação humana clássica não sumiu, ficou mais cara

Demite-se, compra-se IA, automatiza-se processo, e a intuição promete o alívio óbvio: menos gente na folha, menos gente pra alinhar. Na operação acontece o contrário. Quem sobra depois da poda movida a IA costuma ser mais sênior, mais especialista, mais caro por hora. A folha encolhe em cabeças e a hora média do que restou sobe.

A aresta H2H não ficou mais rara, ficou mais cara por unidade. Aquela reunião de 90 minutos com quatro sêniores pra acertar o que sai da IA custava, na conta velha, R$ 1.440. Hoje a mesma reunião sai R$ 1.920. O relógio é o mesmo, a fatura subiu um terço, e o orçamento continua trazendo o número antigo como se nada tivesse mudado.

E a IA ainda inventou um tipo de reunião que não existia: aquela cuja pauta inteira é "como o time anda usando a IA". Calibragem em grupo, alinhamento de prompt, a briga sobre qual ferramenta serve pra qual caso. Sua empresa pode ter três por semana e não contar nenhuma como reunião de produto ou de operação, porque elas moram num canto do calendário sem etiqueta honesta. Quando esse hábito ganha sala fixa e ata, ele atende pelo nome de comitê de IA, o anti-padrão típico de 2026.

Cinco sub-padrões da aresta H2H que a IA criou ou engordou na operação. Custo unitário modelado com hora sênior carregada de R$ 320 numa SaaS BR de porte médio; troque pelo seu custo-hora e a tabela é sua.
Sub-padrão H2H	Frequência típica	Custo unitário	Sinal de alerta
Reunião pra acertar como o time usa a IA	1-3 por semana	R$ 1.200 a R$ 2.800	Aparece na agenda sem dono claro
Sênior ratificando a saída da IA	4-8 por semana, por área	R$ 480 a R$ 960	Número de sêniores não caiu, mesmo com a IA
Especialista acionado quando o agente trava em produção	1-2 por semana, por área crítica	R$ 600 a R$ 1.600	Engenharia sênior interrompida fora da pauta
Comitê pra reaprovar decisão automatizada	1-2 por mês, por área de risco	R$ 2.500 a R$ 8.000	Cliente questionando a lógica da IA
Alinhamento de prompt entre áreas vizinhas	2-4 por semana	R$ 800 a R$ 1.800	Saída da IA destoando entre times

A2A: o silêncio que sai caro

De longe, A2A é a única aresta que parece barata. Token, chamada de API, tempo de máquina: some tudo e dá centavos por interação. O FinOps de infra mede essa parte direitinho, e é aí que mora a armadilha. A conta de verdade não está na fatura da nuvem. Está no sênior chamado pra consertar o que dois agentes não conseguiram entregar um pro outro.

O descompasso de formato é o caso de sempre. O Claude devolve um JSON aninhado; o agente seguinte só engole formato chapado. O Copilot manda 12 campos opcionais; o pipeline lá na frente conta com 8 obrigatórios. Nada disso estoura como erro vermelho na tela. Vem como meia-entrega que alguém precisa ajeitar na mão, e esse alguém ganha salário de sênior.

A adoção de arquitetura multi-agente disparou nos últimos dois anos na operação enterprise, e a maioria das empresas ainda não consegue dizer o que cada agente fez em produção. Numa casa com quatro a seis agentes rodando em pipelines diferentes, o conserto dessas costuras consome de R$ 8 a 15 mil por mês de folha de engenharia sênior, e esse número não está escrito em lugar nenhum.

Tem um sinal mais discreto, e ele aparece na agenda do time técnico. O sênior de engenharia anda "dando uma força" pras áreas que não são técnicas com uma frequência que ninguém somou. Marketing pediu ajuda pra fazer a saída da IA caber no molde do email. Vendas pediu pra arrumar o que o Claude cuspiu antes de entrar no CRM. Cada favorzinho desses é uma aresta A2A com a conta empurrada pra uma folha que não esperava pagar por isso.

H2A: a iteração de prompt é uma linha invisível na folha

H2A é onde o humano cutuca o agente. O ciclo que se vê na prática leva de quatro a seis rodadas de prompt até a saída prestar, algo entre 35 e 50 minutos. E quem está nesse vaivém não é estagiário: a IA já comeu o trabalho do júnior, então quem fica refinando comando é gente cara. Por ciclo, modele de R$ 220 a R$ 400, e refaça com a sua hora carregada.

Essa conta cresce na proporção da adoção. Suponha 40% do time operando com IA no fluxo, cada pessoa rodando uns três ciclos H2A por dia: numa empresa de 500 pessoas, a aresta H2A sozinha pesa de R$ 250 a R$ 460 mil por mês. É dinheiro que não tem campo no ERP nem linha no resultado, mas sai da folha igual.

O sub-padrão mais caro de H2A é a calibragem que incha até abrir uma sala. Você tenta ajeitar o prompt sozinho, emperra, chama o colega que se dá melhor com a máquina, mais quinze minutos. Aí alguém sugere puxar o head pra alinhar a abordagem. De repente são quatro pessoas, vinte minutos extras, três níveis de senioridade na mesma chamada. Custo modelado: R$ 800 a R$ 1.200 por calibragem escalada. E o que era uma aresta H2A desfilou de aresta H2H sem ninguém perceber.

A2H: o ratificador é a aresta mais cara por ciclo

A2H é onde o agente entrega e o humano confere, e é a aresta mais cara por ciclo das quatro. O motivo é simples: quem ratifica costuma ser C-level, head de área ou o sênior mais calejado, hora carregada de R$ 480 a R$ 960. Cada validação queima essa hora pra checar premissa, cruzar com o contexto que a IA não tem como saber e decidir se aceita ou manda fazer de novo.

Quando o agente erra uma premissa de base, e ele erra numa frequência que dá pra contar, o retrabalho dobra. A2H emenda num ciclo atrás do outro: confere, pede correção, recebe saída nova, confere de novo. Dois desses ciclos custam o que três reuniões H2H curtas custariam, e ninguém anotou a despesa.

Aresta A2H: probabilidade de retrabalho por tipo de decisão híbrida e quantos ciclos extras isso cobra. Os intervalos são modelo de ordem de grandeza; calibre com a hora carregada de quem ratifica na sua casa.
Tipo de decisão	Probabilidade retrabalho	Ciclos A2H típicos	Custo total estimado
Preço/cobrança	45-60%	2-3 ciclos	R$ 1.400 a R$ 2.800
Cenário de forecast	30-45%	2 ciclos	R$ 960 a R$ 1.920
Aprovação de contrato com fornecedor	55-70%	3-4 ciclos	R$ 1.920 a R$ 3.840
Análise competitiva	25-40%	1-2 ciclos	R$ 480 a R$ 1.920
Recomendação estratégica	60-75%	3-5 ciclos	R$ 2.400 a R$ 4.800

A conta agregada e o que cada aresta esconde

Junte as quatro arestas numa distribuição plausível pra uma empresa B2B brasileira de porte médio, 500 pessoas, adoção mediana de IA, e o mapa fica assim. Nenhuma dessas linhas aparece separada no forecast, no relatório de eficiência ou na trilha de cada modelo. Some tudo num número só e você tem o total certo da coisa errada.

Como o custo total de coordenação pode se repartir por aresta numa SaaS B2B brasileira de 500 pessoas com adoção mediana de IA (60-70% do time usando algum agente no fluxo). Modelo de ordem de grandeza; ajuste as proporções à sua operação.
Aresta	% do custo total	Custo mensal estimado	Crescendo ou estabilizando?
H2H	45-55%	R$ 2,1 a 2,8 milhões	Crescendo: hora carregada subindo + reuniões novas só sobre IA
A2H	20-30%	R$ 900k a 1,4 milhões	Crescendo: mais saída de IA exige mais ratificação sênior
H2A	12-18%	R$ 480k a 750k	Crescendo rápido: adoção no time todo + iterações por pessoa
A2A	5-10% direto + remediação	R$ 180k a 380k	Crescendo calado: adoção multi-agente em disparada

Somar tudo num bloco esconde duas coisas que mudam a decisão. H2H ainda lidera, mas porque a IA empurrou a hora carregada pra cima, não por causa da velha inércia de reunião. E o A2A dispara junto com a adoção multi-agente, cobrando no conserto humano e não no token. Sem abrir a conta aresta por aresta, toda correção que você tentar é tiro dado de olho fechado. O paradoxo do AI Multiplier desdobra como cada uma dessas distorções come o ganho individual antes dele atravessar pra margem operacional.

Três movimentos pragmáticos pra separar a conta sem ferramenta nova

Pra começar, você não precisa comprar nada. Três movimentos dão conta do primeiro mês. A versão passo a passo do primeiro deles, com o desenho do grafo, a separação por tipo de aresta e a consolidação num radar, está em o inventário das arestas em 30 dias sem ferramenta nova.

Desenhe o caminho de duas ou três decisões recentes. Escolha duas ou três decisões que pesaram nos últimos 30 dias e trace o trajeto de cada uma: quantos humanos, quantos agentes, em que ordem, quantas idas e vindas. Não precisa de software, cabe num guardanapo. Em três decisões, o jeitão da sua empresa já está na sua cara.
Cole um custo em cada aresta com a folha carregada. Hora sênior carregada da sua casa vezes o tempo médio gasto na aresta. Pro agente, use o custo médio de inferência (quase sempre baixo) somado ao conserto humano que ele provoca (quase sempre cobrável). É estimativa grossa de propósito; o que você quer aqui é a ordem de grandeza, não a quinta casa decimal.
Releia a cada trimestre, lado a lado com o forecast. Ponha o número de cada aresta no mesmo painel onde já estão folha e gasto de nuvem, e compare trimestre a trimestre. Se H2H corre mais rápido que a receita, tem distorção te comendo por dentro. Se A2A estoura, a infra multi-agente está cobrando sem ninguém olhar.

O que compliance regulatório vê e o que não vê

A regulação de IA, com o PL 2338 tramitando na Câmara e o EU AI Act entrando em vigor de forma escalonada a partir de agosto de 2026, classifica os sistemas por nível de risco. Cobra inventário, classificação, avaliação de impacto e rastreabilidade de cada decisão automatizada. Tudo isso é necessário e exigível.

Só que nada disso mede aresta de coordenação. A regulação olha o que cada agente faz sozinho, e não o que custa o conjunto se entrosar com os humanos em volta da decisão. Dá pra estar redondo na conformidade e queimar milhões em arestas mal desenhadas no mesmo balanço. O que muda com PL 2338 e EU AI Act em 2026 na sua operação é um vetor paralelo, não substituto. A leitura executiva direta dessa separação (com 5 perguntas que compliance não responde) está em as 5 perguntas que governança econômica responde.

A taxonomia tem ancoragem teórica antiga

Repartir a coordenação em quatro arestas não é invenção de slide. Pega emprestado o vocabulário de duas tradições econômicas que já tinham nome antes de existir LLM. A teoria da coordenação, que classifica as dependências entre as atividades de uma organização. E a teoria da firma, que explica por que a empresa existe pra começar: pra cortar o custo de fazer cada transação no mercado aberto. Quando você joga essas duas lentes na mistura humano-agente de 2026, a velha distinção volta afiada. Coase e Williamson aplicados ao trabalho híbrido de 2026 fecha a outra ponta deste fio.

Perguntas frequentes

O que são as 4 arestas da coordenação humano-agente?

São os quatro tipos de conexão possíveis numa decisão que mistura gente e agente de IA. H2H é humano coordenando humano (reunião, ratificação, o sênior chamado quando o agente trava). A2A é agente passando contexto pra agente (a passagem entre dois pipelines). H2A é humano disparando agente (o prompt refinado seis vezes até a saída prestar). A2H é agente devolvendo trabalho pro humano conferir (validação, premissa checada na unha). Cada uma tem custo unitário, frequência e dono diferentes na operação real, e nenhuma aparece com nome próprio em lugar nenhum.

Por que separar a conta por aresta importa?

Porque cada aresta engorda por um gatilho diferente. H2H sobe quando você corta gente e quem fica é mais sênior. A2A sobe quando você adota arquitetura multi-agente, e a adoção disparou nos últimos dois anos. H2A e A2H sobem quando o time inteiro passa a operar com IA dentro do fluxo. Somar as quatro num único número é apagar exatamente a informação que você precisa: onde está vazando. E sem saber onde vaza, qualquer correção é tiro no escuro.

Qual aresta sai mais cara em uma empresa B2B brasileira mid-market?

Por volume, H2H domina, na faixa de 45 a 55% do custo total de coordenação numa SaaS BR de 500 pessoas. Mas por ciclo, A2H é a mais cara: cada ratificação sênior custa de R$ 480 a R$ 960 de hora carregada. A traiçoeira é A2A: parece centavos no token e cobra na folha de engenharia sênior, calada, quando a passagem entre agentes não fecha conta e alguém precisa arrumar.

Isso é o mesmo que MCP, agent handoff ou multi-agent orchestration?

Não, e a confusão custa caro. MCP, agent handoff e orquestração multi-agent são tecnologia e padrão de arquitetura: respondem o COMO. As quatro arestas são uma leitura econômica de QUEM PAGA o quê, atravessada por essas tecnologias. Sua empresa pode ter zero MCP em produção e as quatro arestas ativas em moeda mesmo assim, porque a passagem entre dois agentes às vezes é um copia-e-cola feito por um sênior, e copia-e-cola de sênior tem preço.

Como começar a medir aresta por aresta sem instrumentação técnica?

Três movimentos, nenhuma ferramenta nova. Pegue duas ou três decisões importantes que sua empresa fechou no mês passado e desenhe o caminho de cada uma no papel: quantos humanos, quantos agentes, em que ordem. Cole um custo em cada aresta, hora sênior carregada para o H, custo médio de inferência para o A. Compare as decisões e veja qual aresta pesou em qual padrão. Três decisões bastam pra ordem de grandeza pular na sua frente.

O fechamento

A pergunta que vale a pena fazer não é mais quanto custa coordenar. É quanto custa cada aresta da coordenação híbrida e qual delas está subindo mais rápido do que a sua margem aguenta. São quatro contas, quatro gatilhos, quatro jeitos de estancar o vazamento, e quem mistura tudo perde os quatro de vista de uma vez.

A empresa que abre as quatro mexe com bisturi. A que olha o bloco único atira no breu e só vai descobrir no fechamento seguinte que tem coisa que não bate, sem conseguir apontar o quê. Em 2026 essa diferença começa a vazar pro resultado consolidado. Em 2027 ela aparece no preço que o mercado paga pela sua empresa.

A ferramenta que mede isso com precisão ainda é tosca; a lógica que separa as arestas, essa já está de pé e não depende de software pra rodar. Sobra a você uma escolha de timing: separar agora, com guardanapo e hora carregada, ou esperar o conselho cobrar a conta aberta por aresta no dia em que já for tarde pra improvisar.