Empresas reduzem uso de IA após custos crescerem inesperadamente
O entusiasmo inicial com a inteligência artificial (IA) está dando lugar a uma cautela crescente entre as grandes corporações. Empresas que rapidamente implementaram ferramentas de IA para seus funcionários agora estão impondo restrições e buscando otimizar custos, à medida que a escala de uso revela um cenário financeiro mais desafiador do que o esperado. Gigantes como Amazon, Walmart, Cisco, Uber e Meta estão entre as pioneiras em estabelecer limites, desestimular o uso supérfluo ou direcionar seus colaboradores para modelos de IA mais econômicos, numa tentativa de manter os orçamentos sob controle.
Essa mudança de postura marca uma nova fase na adoção corporativa da IA. Com a transição de simples chatbots para agentes de IA mais sofisticados – capazes de executar tarefas complexas autonomamente, mas que demandam consideravelmente mais poder de processamento –, as empresas são forçadas a uma análise minuciosa: cada comando (ou ‘prompt’) e cada tarefa automatizada realmente justificam o custo envolvido?
A pressão sobre os gastos com IA se intensificou especialmente após empresas como Anthropic e OpenAI migrarem parte de seus serviços de modelos de assinatura fixa para a cobrança baseada em tokens. Essa métrica, que contabiliza as unidades de dados processadas pelos modelos de IA, expõe as empresas de forma mais direta ao custo real de cada interação e fluxo de trabalho automatizado.
“Os custos de computação estão começando a chamar a atenção tanto dos diretores financeiros quanto dos conselhos de administração. Consumidores e empresas foram levados a crer que a IA é barata ou até gratuita, o que definitivamente não é o caso”, afirma Costi Perricos, líder global de IA generativa na Deloitte. Essa percepção de custo-benefício está sendo reavaliada.
Sam Altman, CEO da OpenAI, reconheceu recentemente que o custo se tornou um “grande problema” para os clientes em 2026. “O assunto nunca veio à tona [no passado]… as pessoas estavam totalmente satisfeitas com o valor que estavam gastando”. A expectativa é que essa questão se torne ainda mais proeminente nos próximos anos.
Uber impõe limites de gastos com IA
O presidente e diretor de operações da Uber, Andrew Macdonald, revelou que está se tornando “mais difícil justificar” os gastos da empresa com tokens de IA. “É muito difícil traçar uma linha direta entre uma dessas estatísticas e dizer ‘Ok, agora estamos realmente produzindo 25% mais recursos úteis para o consumidor'”, declarou em um podcast recente. A empresa de transporte por aplicativo, que havia estourado todo o seu orçamento de IA para 2026 até abril, introduziu limites de uso, restringindo os funcionários a US$ 1.500 em gastos mensais com tokens em ferramentas individuais de IA. A Bloomberg foi a primeira a noticiar essa medida.
Walmart otimiza uso de agente de IA interno
O Walmart também adotou uma estratégia semelhante, limitando o uso de seu agente de IA interno, o Code Puppy, estabelecendo um teto para o número de tokens que os funcionários podem utilizar. Suresh Kumar, diretor global de tecnologia do Walmart, comentou que o uso da plataforma interna de programação por comando (vibe-coding) da empresa “realmente disparou”. “Esta é agora uma oportunidade para darmos um passo atrás”, disse Kumar, acrescentando que os funcionários estão sendo instruídos a identificar as ferramentas mais adequadas para cada atividade específica, buscando maior eficiência e controle de custos.
Cisco equilibra inovação e custo de agentes de IA
Jeetu Patel, presidente e diretor de produtos da Cisco, destacou que as empresas enfrentam o desafio de equilibrar o desejo de adotar a tecnologia de agentes de IA com os custos e a disponibilidade de tokens. “A quantidade de infraestrutura necessária para um agente é significativamente maior do que para um chatbot”, explicou Patel. “Para cada humano, você pode ter 10, 100 ou, no cenário mais agressivo, 1.000 agentes… eles simplesmente continuam trabalhando, e isso consome uma grande fatia de [processamento]”.
Previsões apontam para aumento de 24 vezes no consumo de tokens
Analistas do Goldman Sachs projetaram em maio que o uso de agentes de IA resultará em um aumento de 24 vezes no consumo de tokens até 2030. Esse crescimento exponencial na demanda pode agravar a escassez de chips nos próximos 12 a 18 meses, pressionando ainda mais a cadeia de suprimentos e os custos de infraestrutura.
Embora o uso de tokens e os gastos com IA pelas empresas continuem em trajetória ascendente, os esforços para conter custos podem impactar o crescimento de grandes laboratórios de IA como Anthropic e OpenAI, que planejam abrir capital na bolsa americana ainda este ano, com avaliações de mercado próximas a US$ 1 trilhão. A sustentabilidade desses modelos de negócio em face da demanda crescente por poder computacional é um ponto de atenção.
China ganha vantagem com IA mais barata
Em um desenvolvimento notável, os modelos de IA chineses superaram seus concorrentes norte-americanos em consumo de tokens, segundo dados da OpenRouter, uma plataforma que agrega acesso a múltiplos modelos de IA. A energia mais barata na China e o desenvolvimento de modelos mais eficientes permitiram que os laboratórios de IA do país cobrassem menos por token em comparação com os principais grupos dos EUA, conferindo à China uma nova vantagem competitiva no campo da inteligência artificial.
Pequenas empresas sentem o impacto dos custos de IA
Empresas de menor porte também estão sentindo a pressão dos custos. O grupo de software Workato relatou que seu uso de IA explodiu após seus 1.300 funcionários começarem a utilizar agentes de IA em meados do ano passado. “O uso se espalhou como fogo em palha, as pessoas começaram a transformar de verdade seus empregos com os agentes”, afirmou o diretor de tecnologia, Carter Busse. No entanto, a empresa foi pega de surpresa quando a Anthropic mudou seu modelo de cobrança para preços baseados em tokens em maio. “Nosso gasto aumentou sete vezes no primeiro dia e eu pensei: ‘caramba, criamos um monstro'”, relembrou Busse. “As empresas de grandes modelos de linguagem [LLMs] vinham subsidiando todo o nosso uso e agora não fazem mais. O preço baseado em usuários protegia você”.
Em vez de restringir o acesso, Busse está focado em conter os gastos e redirecionou suas sessões de capacitação em IA para promover ideias de economia de custos, como o uso padrão de modelos mais antigos e baratos da Anthropic. “Em vez de inovação, vamos falar sobre responsabilidade financeira em IA”, comentou.
Amazon e Meta ajustam políticas de uso de IA
Empresas maiores também têm ajustado seus incentivos e a comunicação interna sobre a adoção de IA. A Amazon alertou seus funcionários no mês passado para pararem de usar “IA apenas pelo prazer de usar IA”, após engenheiros começarem a implantar agentes com o único propósito de subir em painéis de liderança internos (leaderboards). O grupo foi forçado a mudar sua abordagem de medição de adoção para conter os custos associados ao uso indevido de ferramentas. A Meta tomou medidas semelhantes em abril.
Tanto a Amazon quanto a Meta desenvolveram e implementaram seus próprios modelos, mas também dependem de terceiros, como a Anthropic, para modelos e ferramentas como o Claude Code. Grupos e plataformas de IA buscam preservar a adoção direcionando usuários para longe de modelos de ponta caros quando não são necessários, substituindo-os por versões mais econômicas.
Otimização de custos com roteamento inteligente de modelos
Kyle Daigle, diretor de operações do GitHub, declarou que a Microsoft conversou com os clientes antes de implementar mudanças de preços para discutir “adequação e propósito” com os desenvolvedores. “A pergunta para o usuário é: ‘quais modelos são mais adequados [para o trabalho]?’. Você nem sempre precisa de um modelo de fronteira avançado”, disse Daigle.
A Microsoft e outros provedores de plataformas de IA, incluindo Amazon e Google, já lançaram ferramentas que roteiam as consultas e tarefas dos clientes para o modelo mais relevante dentro de uma série escolhida pelo cliente, visando controlar os custos de forma mais eficaz. Essa abordagem permite que as empresas utilizem o poder computacional de forma mais direcionada e econômica.
Enquanto isso, algumas empresas orientaram os funcionários a usar modelos de código aberto (open-source) que podem ser executados localmente em seus próprios servidores ou dispositivos pessoais. Essa estratégia reduz a dependência de provedores de nuvem e laboratórios de IA, diminuindo a conta final paga por serviços de IA.
O dilema entre custo e produtividade
Apesar dos esforços de otimização e controle de custos, as empresas ainda estão ponderando o impacto financeiro em relação às promessas feitas aos investidores sobre o impacto da IA em seus lucros e na produtividade dos trabalhadores. “Nossos engenheiros querem mais tokens e temos que descobrir uma maneira de financiar isso”, concluiu Patel, da Cisco, ilustrando o desafio contínuo de equilibrar a inovação impulsionada pela IA com a sustentabilidade financeira.
A adoção de IA no ambiente corporativo entra, portanto, em uma nova fase de maturidade, onde a eficiência de custos e a justificativa de investimento se tornam tão cruciais quanto a própria capacidade tecnológica. A inteligência artificial demonstra seu potencial transformador, mas seu uso em larga escala exige uma gestão financeira estratégica e adaptativa.