Model Update2026-07-03
VentureBeat
Framework da Alibaba corta uso de tokens em 99% em agentes
Pesquisadores da Alibaba desenvolveram um framework inovador de IA que reduz drasticamente o consumo de tokens ao pular o carregamento de todas as ferramentas disponíveis, alcançando uma impressionante redução de 99% no uso de tokens. Essa inovação aborda um dos desafios mais urgentes na IA empresarial: o alto custo e a ineficiência de rotear subtarefas para as ferramentas e habilidades corretas.
À medida que os sistemas de IA empresarial escalam para lidar com fluxos de trabalho cada vez mais complexos, eles frequentemente precisam interagir com dezenas ou até centenas de ferramentas, APIs e fontes de dados diferentes. Abordagens tradicionais carregam informações sobre todas as ferramentas disponíveis, consumindo quantidades massivas de tokens e aumentando significativamente os custos.
O novo framework da Alibaba adota uma abordagem mais inteligente. Em vez de carregar todas as descrições de ferramentas antecipadamente, ele determina dinamicamente quais ferramentas são realmente necessárias para uma determinada tarefa e carrega apenas essas. Esse mecanismo de carregamento seletivo reduz drasticamente o consumo de tokens, mantendo ou até melhorando a precisão na conclusão de tarefas.
As implicações para a implantação de IA empresarial são substanciais. Os custos de tokens são uma das maiores despesas operacionais para organizações que executam sistemas de IA em escala. Uma redução de 99% no uso de tokens se traduz diretamente em economias massivas de custos, tornando a implantação de IA mais viável economicamente para uma gama mais ampla de aplicações.
Além da redução de custos, o framework também melhora a eficiência. Ao eliminar o carregamento desnecessário de ferramentas, os agentes de IA podem processar solicitações mais rapidamente e lidar com mais tarefas simultâneas. Isso é particularmente valioso para aplicações em tempo real onde o tempo de resposta é crítico, como chatbots de atendimento ao cliente ou sistemas de negociação automatizados.
O framework também aborda o desafio de rotear subtarefas para as ferramentas certas. Em fluxos de trabalho complexos, determinar qual ferramenta deve lidar com qual subtarefa é frequentemente um gargalo. A abordagem da Alibaba inclui mecanismos inteligentes de roteamento que garantem que cada subtarefa seja direcionada para a ferramenta mais apropriada, sem desperdiçar tokens em opções irrelevantes.
Essa inovação pode acelerar a adoção de IA empresarial ao remover uma das principais barreiras: o custo. À medida que as organizações percebem que a IA pode ser implantada de forma eficiente e econômica, elas podem estar mais dispostas a investir em implementações de IA em larga escala em suas operações.