Ritometrics.
Voltar ao Journal
11 min de leitura

As 4 arestas da coordenação humano-agente: H2H, A2A, H2A, A2H em moeda

Toda decisão híbrida atravessa quatro tipos de aresta. Cada uma tem custo distinto, cada uma sai vencedora em padrões diferentes. Ninguém mede separado, e por isso a fatura escapa.

Resumo em 90 segundos

Toda decisão importante na sua empresa hoje atravessa um grafo. Os nós são humanos ou agentes de IA. As arestas, ou seja, as conexões entre nós, são onde o custo de coordenação vive. Quatro tipos de aresta possíveis: H2H, A2A, H2A, A2H. Cada uma tem comportamento econômico distinto. Pesquisa de mercado 2026 mostra arquiteturas multi-agent crescendo 327% em quatro meses, com apenas 23% das empresas conseguindo inventariar e rastrear ações de agentes. Tratar as quatro como bloco único esconde a maior distorção econômica que a onda de IA introduziu na operação. Separar a conta é o primeiro movimento honesto pra capturar o ganho real do investimento em IA.

Pense numa decisão recente que envolveu IA. Renovação de cliente, ajuste de pricing, aprovação de orçamento, contratação técnica. Provavelmente ela passou por três humanos e dois agentes antes de virar uma ação.

Um analista pediu ao Claude um rascunho com três cenários. O Claude devolveu, o analista calibrou a saída em três iterações. Mandou o output pro head de finance, que abriu o Copilot, cruzou com benchmarks internos, devolveu duas perguntas pro analista. Daí entraram em reunião com a liderança financeira pra ratificar. Uma única decisão. Três humanos. Dois agentes. Quatro tipos diferentes de aresta percorridos.

Cada aresta carrega conta distinta. Cada uma sai vencedora em padrões diferentes. Ninguém mede separado. Por isso a fatura escapa.

O grafo da decisão moderna tem quatro tipos de aresta

Os nós do grafo de coordenação da sua empresa em 2026 são de dois tipos. Tipo H, humano: pessoa do time, terceirizado, contratado externo. Tipo A, agente: LLM com tool use, agente autônomo, sistema de decisão automatizada operando como nó da rede. As arestas, ou seja, as conexões entre nós, só podem ser quatro combinações.

As 4 arestas canônicas da coordenação humano-agente, com exemplo concreto, custo dominante e dono típico do payroll na empresa B2B BR mid-market. Calibração com discovery em C-levels brasileiros pós-Série B.
ArestaMovimentoExemplo concretoCusto dominanteQuem paga
H2HHumano coordena humanoReunião pra calibrar como o time está usando o Claude. Ratificação de output de IA por sênior. Escalation quando o agente trava.Tempo síncrono × custo unitário sêniorPayroll do grupo todo presente
A2AAgente passa contexto pra agenteOutput do Claude reformatado pra entrar no Copilot. Handoff multi-agent. Schema mismatch entre dois pipelines.Tokens (baixo) + remediação humana quando handoff falha (alto e silencioso)Payroll de eng sênior na remediação
H2AHumano dispara agenteAnalista escreve prompt, refina 4-6 vezes até saída ficar utilizável. Calibração contínua de comando.Tempo sênior × ciclos de iteração de promptPayroll do operador humano
A2HAgente devolve, humano validaRatificador olha output da IA, verifica premissas, pede iteração nova. Retrabalho quando o agente erra premissa fundamental.Tempo de ratificação sênior × probabilidade de retrabalhoPayroll do ratificador (mais caro)

Cada aresta tem comportamento econômico distinto. Cada uma cresce por gatilho diferente. Tratá-las como bloco único é exatamente o que produz a fatura escondida que carrega a maior parte do custo de coordenação humano-agente em empresas que adotaram IA nos últimos 18 meses.

H2H: a coordenação humana clássica não desapareceu. Ficou mais cara.

Empresas estão demitindo, comprando IA, automatizando processo. A intuição é direta: menos gente, menos coordenação. A realidade operacional é o oposto. Quem sobra pós-onda de enxugamento IA-driven é tipicamente mais sênior, mais especialista, mais multidisciplinar. Hora carregada média do time sobe.

A aresta H2H não diminuiu em frequência. Aumentou em custo unitário. Reunião de 90 minutos com quatro sêniores pra calibrar saída de IA: pré-onda custava R$ 1.440. Pós-onda custa R$ 1.920. Mesma reunião, 33% mais cara, ninguém recalculou a equação.

Tem mais. A IA introduziu um sub-padrão H2H novo: reuniões cuja única pauta é "como o time está usando a IA". Calibragem coletiva, alinhamento de prompt, decisão sobre que ferramenta usar pra que caso. Sua empresa pode ter três dessas por semana e nem contar como reunião de produto ou de operação. Está em algum lugar do calendário sem rótulo limpo. A institucionalização desse sub-padrão chama-se, no anti-padrão típico de 2026, comitê de IA.

Cinco sub-padrões da aresta H2H induzidos ou amplificados pela introdução de IA na operação. Custo unitário em payroll sênior carregado médio R$ 320/h numa empresa SaaS BR pós-Série B.
Sub-padrão H2HFrequência típicaCusto unitárioSinal de alerta
Reunião pra calibrar uso de IA pelo time1-3 por semanaR$ 1.200 a R$ 2.800Aparece na agenda sem dono claro
Ratificação de output de IA por sênior4-8 por semana, por áreaR$ 480 a R$ 960Headcount sênior não diminuiu apesar da IA
Escalation quando o agente trava em produção1-2 por semana, por área críticaR$ 600 a R$ 1.600Time de eng sênior interrompido fora da pauta
Comitê pra reaprovar decisão automatizada1-2 por mês, por área de riscoR$ 2.500 a R$ 8.000Cliente questionando lógica da IA
Alinhamento de prompt entre áreas adjacentes2-4 por semanaR$ 800 a R$ 1.800Output da IA inconsistente entre times

A2A: o silêncio que sai caro

A aresta A2A é a única que parece barata por inferência direta. Custo de tokens, custo de API call, custo de tempo de máquina. Tudo isso somado fica nos centavos por interação. FinOps de infra captura essa parte com precisão decente. O problema mora na ponta da remediação humana quando o handoff entre dois agentes não fecha conta.

Schema mismatch é o caso clássico. Output do Claude vem em JSON com estrutura aninhada; formato esperado pelo agente downstream é flat. Output do Copilot tem 12 campos opcionais; o pipeline seguinte assume só 8 obrigatórios. Esses descompassos não aparecem como erro fatal. Aparecem como output parcial que precisa ser reformatado por alguém. Alguém com salário sênior.

Pesquisa de mercado consolidada em 2026 mostra que arquiteturas multi-agent cresceram 327% em quatro meses na operação enterprise. Apenas 23% das empresas conseguem inventariar e rastrear todas as ações de agentes em produção. Em empresa com 4-6 agentes diferentes operando em pipelines distintos, a conta de remediação A2A em payroll de eng sênior chega a R$ 8 a 15 mil por mês sem ninguém somar.

Tem outra sinalização menos óbvia. O time de eng sênior está "ajudando" áreas não-técnicas com cada vez mais frequência. Marketing pediu pra ajudar a fazer o output da IA caber no template de email. Vendas pediu pra normalizar o que o Claude devolveu pra entrar no CRM. Cada uma dessas remediações é aresta A2A com custo migrado pra payroll que ninguém esperava.

H2A: a iteração de prompt é uma linha invisível de payroll

A aresta H2A é onde o humano dispara o agente. Em discovery com C-levels brasileiros pós-Série B, o ciclo típico tem quatro a seis iterações de prompt até a saída do agente ficar utilizável. Tempo médio entre 35 e 50 minutos. Quem está calibrando é sênior. A IA já automatizou o júnior. Custo unitário fica entre R$ 220 e R$ 400 por ciclo.

A conta H2A escala com o nível de adoção. Se 40% do seu time agora opera com IA no fluxo, e cada pessoa roda em média três ciclos H2A por dia, a aresta H2A em uma empresa de 500 FTEs custa entre R$ 250 e R$ 460 mil por mês. Linha invisível. Não tem campo no ERP. Não tem linha no P&L.

O sub-padrão mais caro de H2A é o ciclo de calibração que vira reunião. Você começa tentando refinar prompt sozinho. Depois de duas tentativas frustradas chama o colega que é melhor com IA. Mais quinze minutos. Daí decidem chamar o head pra alinhar abordagem. Quatro pessoas, vinte minutos a mais, três níveis de sênior. Custo: R$ 800 a R$ 1.200 por sessão de calibração escalada. E uma aresta H2A virou uma aresta H2H disfarçada.

A2H: o ratificador é a aresta mais cara por ciclo

A aresta A2H é onde o agente devolve output e o humano valida. Custo unitário mais alto entre as quatro. Por que: o ratificador é tipicamente C-level, head de área ou sênior experiente. Hora carregada na faixa de R$ 480 a R$ 960. Cada ciclo de validação consome essa hora pra checar premissa, cruzar com contexto que a IA não tem, decidir se aceita ou pede iteração nova.

Quando o agente erra premissa fundamental, e ele erra com frequência mensurável, retrabalho duplica. A2H vira ciclo encadeado: ratifica, pede iteração, novo output, ratifica de novo. Dois ciclos A2H custam o que três reuniões H2H curtas teriam custado. E ninguém mediu.

Aresta A2H: probabilidade típica de retrabalho por tipo de decisão híbrida e impacto em ciclos adicionais. Calibração com discovery operacional B2B BR mid-market.
Tipo de decisãoProbabilidade retrabalhoCiclos A2H típicosCusto total estimado
Pricing/cobrança45-60%2-3 ciclosR$ 1.400 a R$ 2.800
Cenário de forecast30-45%2 ciclosR$ 960 a R$ 1.920
Aprovação de contrato vendor55-70%3-4 ciclosR$ 1.920 a R$ 3.840
Análise competitiva25-40%1-2 ciclosR$ 480 a R$ 1.920
Recomendação estratégica60-75%3-5 ciclosR$ 2.400 a R$ 4.800

A conta agregada e o que cada aresta esconde

Quando você junta as quatro arestas em distribuição típica numa empresa B2B brasileira mid-market de 500 FTEs com adoção média de IA, o mapa fica assim. Nada disso aparece discriminado em forecast, em relatório de eficiência, em audit trail de modelo.

Distribuição típica do custo total de coordenação por aresta numa SaaS B2B brasileira 500 FTEs com adoção média de IA (60-70% do time usando algum agente no fluxo). Estimativa com discovery acumulado em C-levels pós-Série B.
Aresta% do custo totalCusto mensal estimadoCrescendo ou estabilizando?
H2H45-55%R$ 2,1 a 2,8 milhõesCrescendo: hora carregada subindo + reuniões IA-pauta novas
A2H20-30%R$ 900k a 1,4 milhõesCrescendo: mais output IA exige mais ratificação sênior
H2A12-18%R$ 480k a 750kCrescendo rápido: adoção em time todo + iterações por usuário
A2A5-10% direto + remediaçãoR$ 180k a 380kCrescendo silencioso: 327% multi-agent growth

Tratar como bloco único esconde duas distorções importantes. H2H ainda domina, mas por distorção IA-driven, não por inércia pré-IA. A2A está escalando rápido com adoção multi-agent e cobra na remediação humana, não nos tokens. Sem separar a conta, qualquer ação corretiva é chute. O paradoxo do AI Multiplier desdobra como cada uma dessas distorções come o ganho individual antes dele atravessar pra margem operacional.

Três movimentos pragmáticos pra separar a conta sem ferramenta nova

Não precisa de software novo pra começar. Três movimentos cobrem o essencial do primeiro mês. A versão passo-a-passo do primeiro movimento (mapeamento de grafo, classificação por tipo de aresta, consolidação em radar) está em o inventário das arestas em 30 dias sem ferramenta nova.

  1. Mapear o grafo de duas ou três decisões recentes. Pegar duas ou três decisões importantes da empresa nos últimos 30 dias. Desenhar o caminho delas: quantos H, quantos A, em que ordem, quantas iterações. Não precisa de ferramenta. Cabe em uma folha de papel ou um slide. Em três decisões, o padrão da sua empresa já aparece.
  2. Atribuir custo por aresta com payroll carregado. Salário sênior carregado da sua empresa multiplicado por tempo médio na aresta. Para A usar custo médio de inferência (geralmente baixo) mais custo de remediação humana estimado (quase sempre cobrável). Margem de erro de 15-25% é aceitável pra ordem de grandeza.
  3. Revisar trimestralmente, junto com forecast. Colocar o número de cada aresta no mesmo radar que payroll e cloud spend. Trimestre a trimestre, comparar. Se H2H cresce mais rápido que ARR, tem distorção amplificadora. Se A2A explode, infraestrutura multi-agent está cobrando sem governança.

O que compliance regulatório vê e o que não vê

Compliance regulatório de IA, com PL 2338 tramitando na Câmara no Brasil e EU AI Act em vigor escalonado a partir de agosto de 2026, regula sistemas de IA classificados por nível de risco. Exige inventário de sistemas, classificação por risco, avaliação de impacto, trilha de auditoria por decisão automatizada. Necessário e enforceable.

Nada disso mede aresta de coordenação. Compliance regula o que cada agente faz isolado. Não mede o que custa o conjunto coordenar com humanos em volta da decisão. Sua empresa pode estar 100% em conformidade e ainda assim queimar milhões em arestas mal mapeadas. O que muda com PL 2338 e EU AI Act em 2026 na sua operação é um vetor paralelo, não substituto. A leitura executiva direta dessa separação (com 5 perguntas que compliance não responde) está em as 5 perguntas que governança econômica responde.

A taxonomia tem ancoragem teórica antiga

A separação em quatro arestas não saiu do nada. Pega emprestado vocabulário de duas tradições econômicas. Coordination theory, que classifica dependências entre atividades de organização. Theory of the firm, que explica por que empresas existem como mecanismos de redução de custo de transação. Aplicada à composição mista humano-agente de 2026, a taxonomia ganha relevância nova. Coase e Williamson aplicados ao trabalho híbrido de 2026 fecha a outra ponta deste fio.

Perguntas frequentes

O que são as 4 arestas da coordenação humano-agente?

São os quatro tipos de conexão possíveis numa decisão que envolve humanos e agentes de IA. H2H é humano coordenando humano (reuniões, ratificação, escalation). A2A é agente passando contexto pra agente (handoff multi-agent). H2A é humano disparando agente (iteração de prompt, calibração). A2H é agente devolvendo output pra humano (validação, ratificação). Cada aresta tem custo unitário, frequência e dono diferentes na operação real.

Por que separar a conta por aresta importa?

Porque cada aresta cresce por gatilho distinto. H2H cresce quando você corta gente e quem fica é mais sênior. A2A cresce quando você adota arquitetura multi-agent (a literatura mostra 327% de crescimento em quatro meses). H2A e A2H crescem quando o time todo passa a operar com IA no fluxo. Sem separar, você não sabe onde está vazando. E sem saber onde está vazando, qualquer ação corretiva vira chute.

Qual aresta sai mais cara em uma empresa B2B brasileira mid-market?

H2H domina em volume (45-55% do custo total de coordenação) numa empresa SaaS BR de 500 FTEs. Mas A2H tem o custo unitário mais alto (R$ 480-960 por ciclo de ratificação sênior). A pegadinha está em A2A: parece barato por inferência, mas cobra caro na ponta da remediação humana quando o handoff entre agentes falha. Cresce silenciosa na conta de payroll de eng sênior.

Isso é o mesmo que MCP, agent handoff ou multi-agent orchestration?

Não. MCP, agent handoff e multi-agent orchestration são tecnologias e padrões de arquitetura. Resolvem o COMO. As 4 arestas são uma categorização econômica de QUEM PAGA o quê, atravessada por essas tecnologias. Sua empresa pode ter zero MCP em produção e ainda assim ter as quatro arestas ativas em moeda, porque o handoff entre dois agentes pode ser manual via copy-paste do output, e ainda assim cobra payroll.

Como começar a medir aresta por aresta sem instrumentação técnica?

Três movimentos sem ferramenta nova. Pegar duas ou três decisões importantes recentes da sua empresa e mapear o caminho delas no grafo (quantos H, quantos A, em que ordem). Atribuir custo por aresta usando payroll sênior carregado para H e custo de inferência médio para A. Comparar entre decisões e ver qual aresta foi vencedora em quais padrões. Em três decisões, a ordem de grandeza já aparece.

O fechamento

A pergunta executiva interessante deixou de ser quanto custa coordenação. Virou outra: quanto custa cada aresta da coordenação híbrida e qual delas está crescendo mais rápido que a margem operacional aguenta. Quatro contas distintas, quatro gatilhos diferentes, quatro caminhos de remediação.

A empresa que separa as quatro consegue agir cirúrgica. A que trata como bloco único mira no escuro e descobre, no QBR seguinte, que algo não fecha sem saber dizer o quê. Em 2026 essa diferença começa a aparecer no resultado operacional consolidado. Em 2027 aparece no múltiplo de mercado.

O instrumento de medição ainda é precário. A teoria que sustenta a separação está pronta. Cabe a você decidir se vai começar a separar agora ou se vai esperar o próximo board cobrando explicação granular por aresta.