Amazon cancela ranking de uso de IA para impedir funcionários de inflarem métricas
A Amazon, um dos maiores conglomerados de tecnologia do mundo, tomou uma decisão surpreendente ao desativar um ranking interno que monitorava o uso de ferramentas de inteligência artificial (IA) por seus funcionários. A iniciativa, batizada de ‘Kirorank’, visava incentivar a adoção da tecnologia, mas acabou sendo mal utilizada por alguns colaboradores, que tentaram artificialmente inflar suas métricas de desempenho, gerando custos adicionais significativos para a empresa. A notícia, divulgada pelo Financial Times, levanta questões sobre os desafios na implementação e mensuração do uso de IA em grandes corporações.
Segundo fontes familiarizadas com o assunto, a desativação do ‘Kirorank’ foi comunicada aos trabalhadores nesta semana. Este ranking pontuava os usuários da plataforma de desenvolvimento Kiro, da própria Amazon, com base em suas atividades relacionadas à IA. No entanto, a ferramenta acabou por incentivar a designação de agentes de IA – bots autônomos capazes de executar tarefas em nome dos usuários – para realizar atividades desnecessárias. O objetivo aparente era simplesmente aumentar o volume de uso e, consequentemente, a pontuação.
Por que a Amazon cancelou o ranking de IA?
Dave Treadwell, vice-presidente sênior da Amazon, explicou aos funcionários que o ranking foi criado com “boas intenções”, mas o resultado foi um aumento inesperado nos custos operacionais. Isso ocorreu porque alguns funcionários estavam inflando o consumo de ‘tokens’ de IA – as unidades de dados processadas pelos modelos de inteligência artificial. Treadwell reforçou a mensagem com um apelo direto: “Por favor, não usem IA apenas por usar”. Essa declaração evidencia a preocupação da empresa em garantir que o uso da tecnologia seja produtivo e não apenas uma busca por métricas superficiais.
Em comunicado oficial, a Amazon confirmou que “o painel beta não era uma ferramenta formal ou aprovada e foi descontinuado”. A medida destaca um dilema comum enfrentado por empresas de tecnologia: como incentivar a adoção de novas ferramentas sem criar brechas para manipulação de métricas e aumento de custos de infraestrutura. O caso da Amazon não é isolado; relatos indicam que funcionários da Meta também tentaram melhorar suas posições em tabelas internas semelhantes, aumentando o consumo de tokens de IA.
O contexto por trás da decisão da Amazon
A decisão da Amazon de desativar o ‘Kirorank’ ocorre em um momento de forte investimento da empresa em inteligência artificial. O Financial Times já havia reportado anteriormente que funcionários utilizavam ferramentas como o Kiro e o MeshClaw (uma versão interna da ferramenta OpenClaw) para executar agentes em seu próprio hardware. Alguns funcionários relataram que colegas estavam utilizando esses softwares para gerar atividade adicional de IA, com o intuito de aumentar o consumo de tokens e demonstrar uma maior adoção da tecnologia.
Esse comportamento surge em meio a uma pressão crescente sobre os funcionários para que adotem a IA. A Amazon estabeleceu metas ambiciosas, visando que mais de 80% de seus desenvolvedores utilizem IA semanalmente. O ranking ‘Kirorank’, segundo a própria Amazon, “foi criado por um grupo de funcionários que queria aumentar a consciência sobre como a IA pode acelerar o trabalho”. Contudo, a empresa agora enfatiza o foco em “eficiência operacional”, especialmente após um período de demissões em larga escala destinadas a reduzir custos e financiar os vultosos investimentos em IA.
Investimentos em IA e a busca por eficiência
A Amazon está destinando um montante expressivo de capital para IA e infraestrutura de data centers, com projeções de gastar US$ 200 bilhões em despesas de capital este ano. Essa estratégia de investimento massivo, combinada com a necessidade de otimizar custos, torna a questão da eficiência operacional ainda mais crítica. A mudança na precificação de modelos de IA por laboratórios como a Anthropic, que passaram de taxas mensais fixas para modelos baseados em consumo, também impactou os custos de clientes, incluindo a própria Amazon, que utiliza extensivamente os modelos da Anthropic.
Para mitigar problemas como os observados com o ‘Kirorank’, a Amazon parece estar mudando seu foco para métricas mais qualitativas. Fontes indicam que a empresa começou a utilizar uma métrica chamada ‘implantações normalizadas’. Essa métrica busca evidenciar o uso regular de IA por engenheiros para criar código útil, avaliando assim o sucesso das ferramentas de IA e a adoção da tecnologia de forma mais concreta, em vez de se basear unicamente no consumo de tokens.
Novas métricas e o futuro do uso de IA na Amazon
Dave Treadwell comunicou aos funcionários que a empresa não deseja que eles se concentrem no uso de tokens de IA. Em vez disso, a orientação é clara: focar na construção de produtos melhores e mais eficientes. Essa mudança de paradigma sugere que a Amazon busca uma adoção de IA mais estratégica e orientada a resultados, onde o valor gerado pela tecnologia seja o principal indicador de sucesso, e não o volume de processamento de dados.
A tentativa de incentivar o uso de IA através de rankings, embora bem-intencionada, demonstrou os desafios inerentes à medição e gestão de novas tecnologias em ambientes corporativos complexos. A Amazon, ao desativar o ‘Kirorank’, sinaliza um aprendizado e uma adaptação em sua estratégia, priorizando a eficiência e a geração de valor real sobre métricas de atividade bruta. A empresa agora se volta para formas mais robustas de medir o impacto da IA, garantindo que os investimentos massivos se traduzam em inovação e sucesso comercial.
Resumo da notícia
A Amazon desativou seu ranking interno ‘Kirorank’, que monitorava o uso de IA por funcionários, após constatar que alguns colaboradores inflaram artificialmente suas métricas de desempenho, gerando custos desnecessários de computação. A decisão reflete os desafios de incentivar a adoção de IA sem criar brechas para manipulação e aumento de custos. A empresa agora foca em métricas de eficiência operacional e na criação de valor, como ‘implantações normalizadas’, em vez do consumo bruto de tokens, em meio a investimentos bilionários na área.
| Métrica | Foco | Potenciais Problemas | Adoção pela Amazon |
|---|---|---|---|
| Consumo de Tokens | Volume de processamento de dados | Inflação artificial, custos elevados | Anteriormente incentivado pelo Kirorank, agora desencorajado |
| ‘Kirorank’ (Pontuação de Uso) | Atividade e engajamento com IA | Incentivo a tarefas desnecessárias, manipulação de métricas | Desativado |
| Implantações Normalizadas | Uso regular de IA para código útil | Requer validação de utilidade e impacto | Nova métrica em foco |
| Qualidade e Eficiência | Valor gerado pela IA, melhoria de produtos | Subjetivo, difícil de quantificar diretamente | Objetivo principal da nova abordagem |
O que podemos aprender com a decisão da Amazon?
A experiência da Amazon serve como um estudo de caso valioso para outras organizações que estão explorando a integração de IA em seus fluxos de trabalho. A lição principal é que a simples mensuração do uso pode não ser suficiente e, em alguns casos, pode até ser contraproducente. É fundamental que as empresas desenvolvam métricas que reflitam o valor real e a eficiência gerada pela IA, alinhando os incentivos dos funcionários com os objetivos estratégicos da organização. A busca por “implantações normalizadas” e o foco na construção de produtos melhores indicam um amadurecimento na abordagem da Amazon em relação à inteligência artificial.