As 4 arestas da coordenação humano-agente: H2H, A2A, H2A, A2H em moeda
Toda decisão híbrida atravessa quatro tipos de aresta. Cada uma tem custo distinto, cada uma sai vencedora em padrões diferentes. Ninguém mede separado, e por isso a fatura escapa.
Resumo em 90 segundos
Toda decisão importante na sua empresa hoje atravessa um grafo. Os nós são humanos ou agentes de IA. As arestas, ou seja, as conexões entre nós, são onde o custo de coordenação vive. Quatro tipos de aresta possíveis: H2H, A2A, H2A, A2H. Cada uma tem comportamento econômico distinto. Pesquisa de mercado 2026 mostra arquiteturas multi-agent crescendo 327% em quatro meses, com apenas 23% das empresas conseguindo inventariar e rastrear ações de agentes. Tratar as quatro como bloco único esconde a maior distorção econômica que a onda de IA introduziu na operação. Separar a conta é o primeiro movimento honesto pra capturar o ganho real do investimento em IA.
Pense numa decisão recente que envolveu IA. Renovação de cliente, ajuste de pricing, aprovação de orçamento, contratação técnica. Provavelmente ela passou por três humanos e dois agentes antes de virar uma ação.
Um analista pediu ao Claude um rascunho com três cenários. O Claude devolveu, o analista calibrou a saída em três iterações. Mandou o output pro head de finance, que abriu o Copilot, cruzou com benchmarks internos, devolveu duas perguntas pro analista. Daí entraram em reunião com a liderança financeira pra ratificar. Uma única decisão. Três humanos. Dois agentes. Quatro tipos diferentes de aresta percorridos.
Cada aresta carrega conta distinta. Cada uma sai vencedora em padrões diferentes. Ninguém mede separado. Por isso a fatura escapa.
O grafo da decisão moderna tem quatro tipos de aresta
Os nós do grafo de coordenação da sua empresa em 2026 são de dois tipos. Tipo H, humano: pessoa do time, terceirizado, contratado externo. Tipo A, agente: LLM com tool use, agente autônomo, sistema de decisão automatizada operando como nó da rede. As arestas, ou seja, as conexões entre nós, só podem ser quatro combinações.
| Aresta | Movimento | Exemplo concreto | Custo dominante | Quem paga |
|---|---|---|---|---|
| H2H | Humano coordena humano | Reunião pra calibrar como o time está usando o Claude. Ratificação de output de IA por sênior. Escalation quando o agente trava. | Tempo síncrono × custo unitário sênior | Payroll do grupo todo presente |
| A2A | Agente passa contexto pra agente | Output do Claude reformatado pra entrar no Copilot. Handoff multi-agent. Schema mismatch entre dois pipelines. | Tokens (baixo) + remediação humana quando handoff falha (alto e silencioso) | Payroll de eng sênior na remediação |
| H2A | Humano dispara agente | Analista escreve prompt, refina 4-6 vezes até saída ficar utilizável. Calibração contínua de comando. | Tempo sênior × ciclos de iteração de prompt | Payroll do operador humano |
| A2H | Agente devolve, humano valida | Ratificador olha output da IA, verifica premissas, pede iteração nova. Retrabalho quando o agente erra premissa fundamental. | Tempo de ratificação sênior × probabilidade de retrabalho | Payroll do ratificador (mais caro) |
Cada aresta tem comportamento econômico distinto. Cada uma cresce por gatilho diferente. Tratá-las como bloco único é exatamente o que produz a fatura escondida que carrega a maior parte do custo de coordenação humano-agente em empresas que adotaram IA nos últimos 18 meses.
H2H: a coordenação humana clássica não desapareceu. Ficou mais cara.
Empresas estão demitindo, comprando IA, automatizando processo. A intuição é direta: menos gente, menos coordenação. A realidade operacional é o oposto. Quem sobra pós-onda de enxugamento IA-driven é tipicamente mais sênior, mais especialista, mais multidisciplinar. Hora carregada média do time sobe.
A aresta H2H não diminuiu em frequência. Aumentou em custo unitário. Reunião de 90 minutos com quatro sêniores pra calibrar saída de IA: pré-onda custava R$ 1.440. Pós-onda custa R$ 1.920. Mesma reunião, 33% mais cara, ninguém recalculou a equação.
Tem mais. A IA introduziu um sub-padrão H2H novo: reuniões cuja única pauta é "como o time está usando a IA". Calibragem coletiva, alinhamento de prompt, decisão sobre que ferramenta usar pra que caso. Sua empresa pode ter três dessas por semana e nem contar como reunião de produto ou de operação. Está em algum lugar do calendário sem rótulo limpo. A institucionalização desse sub-padrão chama-se, no anti-padrão típico de 2026, comitê de IA.
| Sub-padrão H2H | Frequência típica | Custo unitário | Sinal de alerta |
|---|---|---|---|
| Reunião pra calibrar uso de IA pelo time | 1-3 por semana | R$ 1.200 a R$ 2.800 | Aparece na agenda sem dono claro |
| Ratificação de output de IA por sênior | 4-8 por semana, por área | R$ 480 a R$ 960 | Headcount sênior não diminuiu apesar da IA |
| Escalation quando o agente trava em produção | 1-2 por semana, por área crítica | R$ 600 a R$ 1.600 | Time de eng sênior interrompido fora da pauta |
| Comitê pra reaprovar decisão automatizada | 1-2 por mês, por área de risco | R$ 2.500 a R$ 8.000 | Cliente questionando lógica da IA |
| Alinhamento de prompt entre áreas adjacentes | 2-4 por semana | R$ 800 a R$ 1.800 | Output da IA inconsistente entre times |
A2A: o silêncio que sai caro
A aresta A2A é a única que parece barata por inferência direta. Custo de tokens, custo de API call, custo de tempo de máquina. Tudo isso somado fica nos centavos por interação. FinOps de infra captura essa parte com precisão decente. O problema mora na ponta da remediação humana quando o handoff entre dois agentes não fecha conta.
Schema mismatch é o caso clássico. Output do Claude vem em JSON com estrutura aninhada; formato esperado pelo agente downstream é flat. Output do Copilot tem 12 campos opcionais; o pipeline seguinte assume só 8 obrigatórios. Esses descompassos não aparecem como erro fatal. Aparecem como output parcial que precisa ser reformatado por alguém. Alguém com salário sênior.
Pesquisa de mercado consolidada em 2026 mostra que arquiteturas multi-agent cresceram 327% em quatro meses na operação enterprise. Apenas 23% das empresas conseguem inventariar e rastrear todas as ações de agentes em produção. Em empresa com 4-6 agentes diferentes operando em pipelines distintos, a conta de remediação A2A em payroll de eng sênior chega a R$ 8 a 15 mil por mês sem ninguém somar.
Tem outra sinalização menos óbvia. O time de eng sênior está "ajudando" áreas não-técnicas com cada vez mais frequência. Marketing pediu pra ajudar a fazer o output da IA caber no template de email. Vendas pediu pra normalizar o que o Claude devolveu pra entrar no CRM. Cada uma dessas remediações é aresta A2A com custo migrado pra payroll que ninguém esperava.
H2A: a iteração de prompt é uma linha invisível de payroll
A aresta H2A é onde o humano dispara o agente. Em discovery com C-levels brasileiros pós-Série B, o ciclo típico tem quatro a seis iterações de prompt até a saída do agente ficar utilizável. Tempo médio entre 35 e 50 minutos. Quem está calibrando é sênior. A IA já automatizou o júnior. Custo unitário fica entre R$ 220 e R$ 400 por ciclo.
A conta H2A escala com o nível de adoção. Se 40% do seu time agora opera com IA no fluxo, e cada pessoa roda em média três ciclos H2A por dia, a aresta H2A em uma empresa de 500 FTEs custa entre R$ 250 e R$ 460 mil por mês. Linha invisível. Não tem campo no ERP. Não tem linha no P&L.
O sub-padrão mais caro de H2A é o ciclo de calibração que vira reunião. Você começa tentando refinar prompt sozinho. Depois de duas tentativas frustradas chama o colega que é melhor com IA. Mais quinze minutos. Daí decidem chamar o head pra alinhar abordagem. Quatro pessoas, vinte minutos a mais, três níveis de sênior. Custo: R$ 800 a R$ 1.200 por sessão de calibração escalada. E uma aresta H2A virou uma aresta H2H disfarçada.
A2H: o ratificador é a aresta mais cara por ciclo
A aresta A2H é onde o agente devolve output e o humano valida. Custo unitário mais alto entre as quatro. Por que: o ratificador é tipicamente C-level, head de área ou sênior experiente. Hora carregada na faixa de R$ 480 a R$ 960. Cada ciclo de validação consome essa hora pra checar premissa, cruzar com contexto que a IA não tem, decidir se aceita ou pede iteração nova.
Quando o agente erra premissa fundamental, e ele erra com frequência mensurável, retrabalho duplica. A2H vira ciclo encadeado: ratifica, pede iteração, novo output, ratifica de novo. Dois ciclos A2H custam o que três reuniões H2H curtas teriam custado. E ninguém mediu.
| Tipo de decisão | Probabilidade retrabalho | Ciclos A2H típicos | Custo total estimado |
|---|---|---|---|
| Pricing/cobrança | 45-60% | 2-3 ciclos | R$ 1.400 a R$ 2.800 |
| Cenário de forecast | 30-45% | 2 ciclos | R$ 960 a R$ 1.920 |
| Aprovação de contrato vendor | 55-70% | 3-4 ciclos | R$ 1.920 a R$ 3.840 |
| Análise competitiva | 25-40% | 1-2 ciclos | R$ 480 a R$ 1.920 |
| Recomendação estratégica | 60-75% | 3-5 ciclos | R$ 2.400 a R$ 4.800 |
A conta agregada e o que cada aresta esconde
Quando você junta as quatro arestas em distribuição típica numa empresa B2B brasileira mid-market de 500 FTEs com adoção média de IA, o mapa fica assim. Nada disso aparece discriminado em forecast, em relatório de eficiência, em audit trail de modelo.
| Aresta | % do custo total | Custo mensal estimado | Crescendo ou estabilizando? |
|---|---|---|---|
| H2H | 45-55% | R$ 2,1 a 2,8 milhões | Crescendo: hora carregada subindo + reuniões IA-pauta novas |
| A2H | 20-30% | R$ 900k a 1,4 milhões | Crescendo: mais output IA exige mais ratificação sênior |
| H2A | 12-18% | R$ 480k a 750k | Crescendo rápido: adoção em time todo + iterações por usuário |
| A2A | 5-10% direto + remediação | R$ 180k a 380k | Crescendo silencioso: 327% multi-agent growth |
Tratar como bloco único esconde duas distorções importantes. H2H ainda domina, mas por distorção IA-driven, não por inércia pré-IA. A2A está escalando rápido com adoção multi-agent e cobra na remediação humana, não nos tokens. Sem separar a conta, qualquer ação corretiva é chute. O paradoxo do AI Multiplier desdobra como cada uma dessas distorções come o ganho individual antes dele atravessar pra margem operacional.
Três movimentos pragmáticos pra separar a conta sem ferramenta nova
Não precisa de software novo pra começar. Três movimentos cobrem o essencial do primeiro mês. A versão passo-a-passo do primeiro movimento (mapeamento de grafo, classificação por tipo de aresta, consolidação em radar) está em o inventário das arestas em 30 dias sem ferramenta nova.
- Mapear o grafo de duas ou três decisões recentes. Pegar duas ou três decisões importantes da empresa nos últimos 30 dias. Desenhar o caminho delas: quantos H, quantos A, em que ordem, quantas iterações. Não precisa de ferramenta. Cabe em uma folha de papel ou um slide. Em três decisões, o padrão da sua empresa já aparece.
- Atribuir custo por aresta com payroll carregado. Salário sênior carregado da sua empresa multiplicado por tempo médio na aresta. Para A usar custo médio de inferência (geralmente baixo) mais custo de remediação humana estimado (quase sempre cobrável). Margem de erro de 15-25% é aceitável pra ordem de grandeza.
- Revisar trimestralmente, junto com forecast. Colocar o número de cada aresta no mesmo radar que payroll e cloud spend. Trimestre a trimestre, comparar. Se H2H cresce mais rápido que ARR, tem distorção amplificadora. Se A2A explode, infraestrutura multi-agent está cobrando sem governança.
O que compliance regulatório vê e o que não vê
Compliance regulatório de IA, com PL 2338 tramitando na Câmara no Brasil e EU AI Act em vigor escalonado a partir de agosto de 2026, regula sistemas de IA classificados por nível de risco. Exige inventário de sistemas, classificação por risco, avaliação de impacto, trilha de auditoria por decisão automatizada. Necessário e enforceable.
Nada disso mede aresta de coordenação. Compliance regula o que cada agente faz isolado. Não mede o que custa o conjunto coordenar com humanos em volta da decisão. Sua empresa pode estar 100% em conformidade e ainda assim queimar milhões em arestas mal mapeadas. O que muda com PL 2338 e EU AI Act em 2026 na sua operação é um vetor paralelo, não substituto. A leitura executiva direta dessa separação (com 5 perguntas que compliance não responde) está em as 5 perguntas que governança econômica responde.
A taxonomia tem ancoragem teórica antiga
A separação em quatro arestas não saiu do nada. Pega emprestado vocabulário de duas tradições econômicas. Coordination theory, que classifica dependências entre atividades de organização. Theory of the firm, que explica por que empresas existem como mecanismos de redução de custo de transação. Aplicada à composição mista humano-agente de 2026, a taxonomia ganha relevância nova. Coase e Williamson aplicados ao trabalho híbrido de 2026 fecha a outra ponta deste fio.
Perguntas frequentes
O que são as 4 arestas da coordenação humano-agente?
São os quatro tipos de conexão possíveis numa decisão que envolve humanos e agentes de IA. H2H é humano coordenando humano (reuniões, ratificação, escalation). A2A é agente passando contexto pra agente (handoff multi-agent). H2A é humano disparando agente (iteração de prompt, calibração). A2H é agente devolvendo output pra humano (validação, ratificação). Cada aresta tem custo unitário, frequência e dono diferentes na operação real.
Por que separar a conta por aresta importa?
Porque cada aresta cresce por gatilho distinto. H2H cresce quando você corta gente e quem fica é mais sênior. A2A cresce quando você adota arquitetura multi-agent (a literatura mostra 327% de crescimento em quatro meses). H2A e A2H crescem quando o time todo passa a operar com IA no fluxo. Sem separar, você não sabe onde está vazando. E sem saber onde está vazando, qualquer ação corretiva vira chute.
Qual aresta sai mais cara em uma empresa B2B brasileira mid-market?
H2H domina em volume (45-55% do custo total de coordenação) numa empresa SaaS BR de 500 FTEs. Mas A2H tem o custo unitário mais alto (R$ 480-960 por ciclo de ratificação sênior). A pegadinha está em A2A: parece barato por inferência, mas cobra caro na ponta da remediação humana quando o handoff entre agentes falha. Cresce silenciosa na conta de payroll de eng sênior.
Isso é o mesmo que MCP, agent handoff ou multi-agent orchestration?
Não. MCP, agent handoff e multi-agent orchestration são tecnologias e padrões de arquitetura. Resolvem o COMO. As 4 arestas são uma categorização econômica de QUEM PAGA o quê, atravessada por essas tecnologias. Sua empresa pode ter zero MCP em produção e ainda assim ter as quatro arestas ativas em moeda, porque o handoff entre dois agentes pode ser manual via copy-paste do output, e ainda assim cobra payroll.
Como começar a medir aresta por aresta sem instrumentação técnica?
Três movimentos sem ferramenta nova. Pegar duas ou três decisões importantes recentes da sua empresa e mapear o caminho delas no grafo (quantos H, quantos A, em que ordem). Atribuir custo por aresta usando payroll sênior carregado para H e custo de inferência médio para A. Comparar entre decisões e ver qual aresta foi vencedora em quais padrões. Em três decisões, a ordem de grandeza já aparece.
O fechamento
A pergunta executiva interessante deixou de ser quanto custa coordenação. Virou outra: quanto custa cada aresta da coordenação híbrida e qual delas está crescendo mais rápido que a margem operacional aguenta. Quatro contas distintas, quatro gatilhos diferentes, quatro caminhos de remediação.
A empresa que separa as quatro consegue agir cirúrgica. A que trata como bloco único mira no escuro e descobre, no QBR seguinte, que algo não fecha sem saber dizer o quê. Em 2026 essa diferença começa a aparecer no resultado operacional consolidado. Em 2027 aparece no múltiplo de mercado.
O instrumento de medição ainda é precário. A teoria que sustenta a separação está pronta. Cabe a você decidir se vai começar a separar agora ou se vai esperar o próximo board cobrando explicação granular por aresta.