Ritometrics.
Voltar ao Journal
12 min de leitura

FinOps de coordenação: a categoria que ninguém mediu

FinOps de cloud mede infra. FinOps de IA mede inferência. Coordenação humano-agente é a terceira camada que falta e ela carrega a maior parte do custo real de operar IA na empresa.

Resumo em 90 segundos

FinOps tem duas ondas consolidadas. A primeira saiu em 2015 medindo cloud spend, virou Foundation em 2019. A segunda chegou em 2024 cobrindo inferência, tokens e GPU. Resolveu o problema do custo que a IA consome como infraestrutura. Falta a terceira: medir o que a IA exige dos humanos pra fechar ciclo. Em B2B BR mid-market 500 FTE típico, infra de IA pega 8 a 12% do custo total real da operação híbrida. Os outros 88 a 92% moram nas arestas de coordenação. FinOps de coordenação é a categoria que ainda não tem dashboard, não tem playbook consolidado, não aparece em RFP de vendor. E é onde a maior fatia do custo está vazando.

Imagine a próxima reunião de orçamento da sua empresa. Você abre a planilha consolidada. Linha de cloud spend está discriminada por workload, por área, por trimestre. Linha nova de inferência de IA apareceu em 2025 e cresceu 40% ano a ano. Bonito. Visibilidade decente. Daí você puxa o relatório de payroll. Folha sênior subiu 18% em headcount estável. Ninguém soube explicar em que linha.

Essa é a fronteira do FinOps em 2026. Cobre o que a IA gasta. Não cobre o que ela exige. E o que ela exige dos humanos pra fechar ciclo cobra muito mais caro do que o que ela consome em token.

FinOps tem duas ondas. A terceira ainda não foi nomeada.

A disciplina FinOps começou simples. Engenharia provisionava recurso na AWS ou GCP, finance recebia a conta no fim do mês sem entender o que tinha comprado. FinOps Foundation, criada em 2019, codificou um vocabulário comum: visibility, optimization, operation. Categorias de spend. Ownership compartilhado entre eng e finance. Cinco anos depois, qualquer empresa que gasta mais de R$ 1 milhão por ano em cloud tem alguém com função FinOps no time.

A segunda onda chegou junto com a explosão de modelos generativos. AI FinOps é a expansão do framework original pra cobrir inferência, tokens, GPU dedicado, modelo fine-tunado, vector database. CloudZero, Vantage, Datadog lançaram módulo de AI spend visibility entre 2024 e 2025. Vendor como OpenAI e Anthropic adicionaram dashboard granular de consumo. Em mid-market mais maduro, AI FinOps já é linha visível no QBR financeiro.

Essas duas ondas resolvem o problema do que a IA consome enquanto roda como tecnologia. Não resolvem o problema do que ela custa enquanto opera como parte da força de trabalho. E essa diferença, em 2026, está onde mora a maior parte da conta agregada.

As 3 ondas de FinOps: o que cobrem, qual é a unidade de medida e em que ano a categoria ficou material no orçamento corporativo. Coordenação humano-agente está no estágio que cloud spend estava em 2017.
Onda FinOpsO que cobreUnidadeAno que virou material
1. Cloud spend (tradicional)Compute, storage, network, SaaS de produtoCusto por workload por mês2018 a 2020
2. AI spend (infra de IA)Tokens, GPU, inferência, modelo fine-tunadoCusto por chamada por modelo2024 a 2025
3. Coordenação humano-agentePayroll em ratificação, calibração, reunião IA-pauta, remediação handoffCusto por aresta por decisão2027 em diante (projetado)

A categoria emergente atravessa os mesmos três pilares da Foundation original. Visibility primeiro: inventariar onde a coordenação humano-agente acontece. Optimization depois: identificar quais arestas crescem mais rápido que ARR. Operation por último: cadência trimestral comparando com payroll e cloud spend no mesmo radar. O que muda é a unidade.

A composição do custo real de IA em B2B BR mid-market

A intuição executiva clássica vai pra cloud bill: a IA é cara porque inferência é cara, GPU é cara, modelo é caro. Dados de discovery em SaaS brasileiras pós-Série B em 2025-2026 contam outra história. Em empresa de 500 FTEs com adoção média de IA (60 a 70% do time usando algum agente no fluxo), a composição do custo total da operação híbrida fica assim.

Composição típica do custo total real da operação de IA numa SaaS B2B brasileira mid-market 500 FTE com adoção média (60-70% do time). Calibração com discovery em C-levels pós-Série B 2025-2026. Margem de 15-25% por categoria aceitável pra ordem de grandeza.
Categoria% do custo totalCusto mensal estimadoFinOps atual cobre?
Infra de IA (tokens, GPU, modelo)8 a 12%R$ 380k a 580kSim, em ferramenta FinOps de IA
Cloud tradicional adjacente (storage, network)4 a 7%R$ 180k a 340kSim, em ferramenta FinOps tradicional
Coordenação humana (H2H induzida por IA)45 a 55%R$ 2,1 a 2,8 milhõesNão, fica embaixo da linha de payroll
Ratificação sênior de output (A2H)18 a 26%R$ 850k a 1,2 milhõesNão, fica embaixo da linha de payroll
Calibração de prompt (H2A)10 a 16%R$ 480k a 750kNão, fica embaixo da linha de payroll
Remediação handoff entre agentes (A2A)3 a 7%R$ 140k a 320kParcial, mistura com payroll de eng sênior

A tabela mostra a distorção de leitura típica. Infra de IA, o que FinOps atual cobre, é entre 8 e 12% do custo. As quatro arestas de coordenação humano-agente somam entre 76 e 88%. Estão diluídas em payroll sem categoria própria. E cada uma cresce por gatilho diferente. A taxonomia H2H, A2A, H2A, A2H em moeda é o vocabulário operacional que falta no playbook FinOps clássico.

Por que FinOps de IA atual não fecha conta de coordenação

A ferramenta FinOps de IA olha pra dentro da chamada de API. Quantos tokens, qual modelo, qual área da empresa requisitou, qual workload em qual horário. Cobre bem o lado da máquina. Conecta finance com eng. Resolve a pergunta de quanto cada produto está custando em inferência.

Nenhuma dessas ferramentas mede o que acontece entre a chamada de API e a decisão executiva final. O analista que iterou seis vezes o prompt antes do output ficar utilizável. O head que ratificou e pediu nova iteração. A reunião de 90 minutos que aconteceu pra alinhar como o time todo está usando aquela ferramenta. Tudo isso é coordenação humana ao redor da IA, e o instrumento atual não tem como capturar.

A consequência é prática. Você recebe o relatório de AI FinOps e vê linha consolidada de R$ 480 mil por mês de inferência. Acha que está caro, negocia desconto com vendor, otimiza modelo, baixa 18%. Boa execução isolada. Total irrelevante diante dos R$ 4,2 milhões mensais que a coordenação ao redor desses agentes está consumindo em payroll sênior sem rótulo na sua empresa.

O playbook FinOps adaptado pra coordenação

O framework não muda. Os três pilares da Foundation original (visibility, optimization, operation) seguem inteiros. Muda a unidade de medida e a fonte de dado. Em vez de chamada de API e workload de cloud, a unidade passa a ser decisão atravessada e aresta percorrida. Em vez de billing log do vendor, a fonte passa a ser cruzamento entre calendário sênior, output de IA e payroll carregado.

Paralelo entre FinOps tradicional (cloud + IA) e FinOps de coordenação. O framework conceitual é o mesmo; a unidade de medida e a fonte de dado mudam pra capturar a categoria invisível.
PilarFinOps tradicionalFinOps de coordenaçãoDiferença prática
VisibilityDashboard de custo por workloadInventário de arestas por decisãoMapa do grafo H2H/A2A/H2A/A2H em 3-5 decisões reais
OptimizationRightsizing, reserved instance, commitmentReduzir aresta que vaza mais, separar pauta de IACortar reunião IA-pauta que poderia ser async, baixar ciclo H2A
OperationTag de custo, allocation por área, alert por thresholdMétrica de custo por decisão, cadência trimestral com payrollLinha nova no QBR ao lado de cloud spend e payroll consolidado

O paralelo é importante porque se você viveu a maturação do FinOps tradicional, já tem músculo pra essa segunda transição. Não precisa framework conceitual novo. Precisa categoria nova dentro do framework que você já opera.

A unidade de medida que a categoria pede: custo por decisão

FinOps tradicional consolidou unidade em custo por workload por mês. FinOps de IA acabou em custo por chamada por modelo. Coordenação humano-agente pede unidade diferente: custo por decisão atravessada.

Uma decisão atravessada é qualquer ciclo que sai de uma pergunta executiva e termina numa ação ratificada. Renovação grande de cliente. Ajuste de pricing pra cohort específica. Aprovação de orçamento de marketing. Cada uma dessas decisões atravessa N humanos e M agentes em alguma ordem. O custo é a soma de cada aresta percorrida.

A unidade é prática por três motivos. Primeiro: cabe na linguagem do board. Decisão é a palavra que você e o resto do C-level já usam pra reportar resultado. Segundo: comparável entre áreas. Decisão de pricing em vendas tem grafo parecido com decisão de pricing em produto. Terceiro: comparável entre empresas. Discovery em SaaS B2B BR mid-market sugere que uma decisão atravessada típica em 2026 custa entre R$ 8 e 15 mil em payroll carregado consolidado. Se sua empresa paga R$ 30 mil por decisão, tem problema estrutural. Se paga R$ 4 mil, provavelmente está deixando contexto fora da ratificação e vai pagar depois.

O que muda na sala do CFO

A próxima reunião de board que pedir explicação granular sobre por que margem operacional consolidada não acompanhou o ganho individual da IA vai pedir resposta em moeda. Você tem três caminhos. Pode dizer que ainda não mediu, e perder credibilidade. Pode chutar com base no relatório de AI FinOps atual, e ser corrigido em três meses quando a conta agregada aparecer pior. Ou pode apresentar a categoria nova: coordenação humano-agente em moeda, separada das duas ondas que já existem.

Essa categoria é onde a economia de IA está vazando em reunião de forma consistente em 2026. Sem ela, qualquer story sobre ROI de IA fica incompleto. Com ela, o CFO ganha o vocabulário que faltava pra explicar gap de margem ao board sem prometer turnaround mágico em três trimestres.

Três movimentos pra começar antes do próximo QBR

Não precisa de software novo. Não precisa de consultor externo. Três movimentos cobrem o essencial pra ter número defensável em 60 dias.

  1. Inventariar 3 decisões atravessadas recentes. Pegar 3 decisões importantes da empresa nos últimos 60 dias que envolveram IA no caminho (não precisa ser as 3 mais relevantes, basta serem representativas). Mapear o grafo: quantos humanos, quantos agentes, em que ordem, quantas iterações em cada aresta. Anotar em uma folha. Em 3 decisões, o padrão da sua empresa aparece.
  2. Atribuir custo carregado por aresta. Aplicar payroll sênior carregado da empresa por hora em cada aresta humana. Aplicar custo médio de inferência por aresta agêntica. Aplicar estimativa de remediação humana por handoff A2A. Margem de erro de 15 a 25% é aceitável pra ordem de grandeza. Comparar custo total da decisão com benchmark de R$ 8 a 15 mil por decisão atravessada típica.
  3. Apresentar a categoria no próximo QBR como linha nova. Não tentar prever crescimento ou propor optimization na primeira apresentação. Só apresentar a categoria existe, qual é a unidade de medida, quanto está custando na ordem de grandeza. Mesmo padrão que CFO usou pra introduzir cloud spend em 2017-2018. Visibilidade primeiro, ação depois.

A ancoragem teórica vem de 1937, não de FinOps Foundation

FinOps Foundation deu o framework operacional pra cobrar visibilidade de tecnologia. Mas a teoria que sustenta a separação em arestas é mais antiga do que cloud. Coase publicou em 1937 que firmas existem porque coordenação interna sai mais barata que coordenação via mercado em certos casos. Williamson refinou em 1985 mostrando que essa equação depende de custo de transação por tipo de aresta. A noção de medir aresta por aresta vem dessa tradição econômica, não da disciplina financeira recente.

A novidade de 2026 é que a quarta estrutura de governance (aresta agêntica) entrou no grafo da firma e mudou o cálculo de aresta humana adjacente. Coase e Williamson aplicados a 2026 dá a fundamentação econômica completa. FinOps de coordenação é o tradução operacional dessa teoria pra disciplina financeira do CFO mid-market hoje.

Perguntas frequentes

O que é FinOps de coordenação?

É a terceira camada da disciplina FinOps aplicada à operação corporativa. FinOps tradicional cobre cloud spend (compute, storage, network). FinOps de IA expandiu pra inferência e tokens em 2024. FinOps de coordenação mede o custo agregado de humanos e agentes operando juntos numa decisão: tempo sênior em ratificação de output, calibração de prompt, reunião pra alinhar uso de IA, remediação de handoff entre agentes. Essa camada não tem categoria orçamentária formal nem ferramenta consolidada em 2026.

Qual a diferença entre FinOps de IA e FinOps de coordenação?

FinOps de IA mede o que a IA consome: tokens, GPU, inferência, custo por modelo, custo por chamada de API. Está numa categoria conhecida (infra) e tem ferramentas (Datadog, CloudZero, Vantage). FinOps de coordenação mede o que a IA exige dos humanos pra fechar ciclo: payroll sênior gasto em ratificar, calibrar, alinhar uso. Em B2B BR mid-market 500 FTE típico, FinOps de IA captura 8-12% do custo total real da operação híbrida. Os outros 88-92% moram nas arestas de coordenação. Sem essa camada, qualquer ROI de IA fica chutado.

Por que CFO deveria se importar com isso?

Três motivos práticos. Primeiro: a margem operacional consolidada não fechou em 2025-2026 apesar do ganho individual da IA, e o board vai cobrar explicação granular no próximo QBR. Segundo: a categoria custa milhões por ano em empresa SaaS BR de 500 FTEs sem aparecer no P&L, fica embaixo da linha de payroll e do cloud spend. Terceiro: capital allocation com IA fica chute sem saber qual aresta vaza mais. CFO já governa cloud spend porque virou material; coordenação humano-agente está no mesmo trajeto, cinco anos atrasado.

Como medir FinOps de coordenação sem ferramenta nova?

Três movimentos cobrem o primeiro mês. Primeiro: pegar 3 decisões importantes recentes (renovação grande, ajuste de pricing, aprovação de orçamento) e mapear o caminho delas, contando quantos humanos e quantos agentes atravessaram e em que ordem. Segundo: aplicar payroll sênior carregado da empresa por aresta humana e custo médio de inferência por aresta agêntica, com margem de 15-25% aceitável pra ordem de grandeza. Terceiro: comparar com cloud spend e payroll na mesma planilha. A categoria fica visível em 30 dias sem investimento em ferramenta.

Isso vai virar produto FinOps formal nos próximos anos?

Tendência forte. FinOps tradicional levou de 2015 a 2020 pra ter categoria de orçamento dedicada nas empresas. FinOps de IA aceitou em 2024-2025 com cloud bills de inferência batendo na casa dos sete dígitos por ano em mid-market. Coordenação humano-agente está no estágio que FinOps de cloud estava em 2017: time pequeno entendeu o problema, vendor builder começou a aparecer, board ainda não cobra. Em 2027-2028 a categoria fica visível em pitch de vendor enterprise e em audit de margem do investidor.

O fechamento

A pergunta executiva interessante deixou de ser quanto a sua empresa gasta em IA. Virou outra: quanto a sua empresa gasta em coordenação humano-agente, e se essa categoria está crescendo mais rápido que ARR. FinOps de cloud levou cinco anos pra virar categoria de orçamento. FinOps de IA aceitou em dois. Coordenação humano-agente, pela velocidade da adoção e pelo tamanho do vazamento, tem horizonte parecido.

Em 2026, ela ainda é o vetor invisível da governança de IA. Em 2027 começa a virar linha visível em QBR de board. Em 2028 vira RFP obrigatório de qualquer vendor enterprise sério. O CFO que assumir a categoria primeiro vai ter três anos de vantagem na narrativa de capital allocation.

O instrumento ainda é precário. A categoria já é mensurável artesanal. A decisão de começar a medir agora ou esperar o board cobrar é o tipo de escolha que define curva de aprendizado nos próximos 18 meses. O painel mínimo defensável tem cinco métricas que medem governança econômica e cinco anti-métricas que atrapalham.