Preço congelado, conta mais alta

A Anthropic anunciou recentemente o lançamento do Claude Opus 4.7, sua atualização de modelo mais recente, com uma nota de rodapé reconfortante: o preço de tabela segue o mesmo. A US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída, a empresa sinaliza estabilidade num mercado cada vez mais competitivo. Uma análise mais atenta das especificações técnicas, porém, revela uma realidade mais complexa. Embora o preço unitário esteja congelado, o número de unidades necessárias para concluir uma tarefa cresceu silenciosamente — um fenômeno que pode ser descrito como "inflação de tokens".

Mais grãos, mais raciocínio, mais consumo

Dois fatores principais explicam esse aumento de consumo. Primeiro, a Anthropic introduziu um tokenizador atualizado — o sistema que decompõe linguagem natural nos blocos matemáticos processados pelo modelo. A nova versão é mais granular, o que significa que o mesmo parágrafo de texto agora se converte em algo entre 1,0 e 1,35 vez mais tokens do que na versão anterior. Segundo, o modelo foi ajustado para "análise mais profunda". No contexto dos grandes modelos de linguagem, "pensar mais" é funcionalmente sinônimo de gerar mais texto interno e externo, sobretudo em fluxos de trabalho agênticos complexos.

Desempenho versus previsibilidade

Essa mudança evidencia uma tensão crescente na indústria de IA entre desempenho e previsibilidade de custos. À medida que os modelos se tornam mais capazes, tendem a ser mais verbosos em suas etapas de raciocínio para garantir precisão. Para o cliente corporativo, o custo por token está se tornando uma métrica menos confiável para planejamento orçamentário do que costumava ser. Na busca por maior confiabilidade e lógica mais robusta, o setor caminha para um paradigma em que a inteligência é medida não apenas pela resposta final, mas pelo volume computacional necessário para alcançá-la.

Com reportagem de Xataka.

Source · Xataka